Hace 1 año | Por DenisseJoel a twitter.com
Publicado hace 1 año por DenisseJoel a twitter.com

DALLE-2 tiene un lenguaje secreto. "Apoploe vesrreaitais" significa pájaros. "Contarra ccetnxniams luryca tanniounons" significa bichos o plagas. El texto "Apoploe vesrreaitais comiendo Contarra ccetnxniams luryca tanniounons" devuelve imágenes de pájaros comiendo insectos. Artículo completo (en inglés): https://giannisdaras.github.io/publications/Discovering_the_Secret_Language_of_Dalle.pdf

Comentarios

celyo

#1 #3 sigo sin enterarme.

Por lo que veo, lo que hace es asignar a conjuntos de letras significados concretos, así que más que un lenguaje, es dar significado a ciertas combinaciones.

Eso yo no lo entiendo como un lenguaje, que contiene una gramática para realizar estructuras más complejas.

Jakeukalane

#4 eso estoy diciendo. No hay tales estructuras. Es un paso más al estar conectado supuestamente en las burbujas de diálogo. Pero sigue sin ser un lenguaje.

e

#16 #15 #13 #7 #5 #4 Pues a mi me parece un cifrado, más que un lenguaje.

Jakeukalane

#30 mira #6. Es justo lo que decía en #3 y lee también a #25. La noticia es errónea pero quise votarla positivo precisamente para que se hablase y se descubriera si era mentira.

I

#31 Y eso que me jode mucho votar este tipo de noticias erróneas. Espero como agua de mayo que corran más rápido las listas de espera de Dall-e

Jakeukalane

#33 yo me registré en abril y hay gente de mayo que ya la tiene así que va a ser que no me la dan.

I

#35 Puedes probar Dall-E mini, no es para nada lo mismo, pero está a medio camino entre VQGAN y Dall-E
https://huggingface.co/spaces/dalle-mini/dalle-mini

Jakeukalane

#55 sí. Está bastante bien. Llevo una semana o así probándola. El otro día la puse en alternativeto.net ah pues es la que me queda de poner. Pensé que ya la había puesto: https://alternativeto.net/software/dall-e/

celyo

#31 sería una mejora interesante en mnm, tener una diferencia entre voto positivo/negativo y luego un "voto interesante".

El_perro_verde

#4 es un dialecto del inglés, usa la estructura del inglés pero inventa sustantivos nuevos que significan conceptos que el inglés no tiene (o que la IA no entiende bien) de forma que puede controlar mejor el significado, no deja de ser una jerga (como cuando un grupo de jóvenes se inventa una palabra para definir una tribu urbana o similar), y de la misma forma solo quien es parte de esa jerga lo entiende, con la diferencia de que ha sido una Ia quien ha inventado la jerga por su propio pie (en principio)

D

#7 Por regla general una palabra si tiene más de dos silabas, no es inglés. Jeje.

k

#7 No he visto nada propio del inglés en ese código.

celyo

#7 ¿pero ha construido una gramática propia?

Si no es así, es más una jerga, llamando a "perro" pues "adsf".

Puede que sea letras al azar o economizando el lenguaje por alguna razón (a los mamiferos los denomina "da", con cuatro patas "bo", con ......)

anv

#16 más bien entiendo que ha inventado palabras para conceptos que no se pueden describir con una sola palabra en inglés.

Algo así como cuando en América Latina llaman "choclo" al maíz que no está maduro. Tengo entendido que los aztecas tenían hasta 7 palabras distintas para nombrar al maíz por su grado de maduración porque el maíz era muy importante en su cultura.

Al parecer la IA está tan especializada en dibujar, que para ella es importante tener palabras específicas para distintos conceptos que pueda dibujar, y si el inglés no las tenía se las ha inventado.

celyo

#49 lo que conocemos como jerga, a mi modo de entender, no como un lenguaje.

El_perro_verde

#16 Pues eso he dicho

RamonMercader

#4 cuando entrenaron a la red le dieron infinidad de imagenes con descripciones, por ejemplo: pájaros volando, pájaros comiendo, león durmiendo, perro saltando, etc...

La red no es nunca consciente de lo que hace, una vez entrenada puede que haya inferido las normas para "perro durmiendo", pero también puede inferir que "Apoploe" es un pajaro.

celyo

#12 pero eso no es un lenguaje.

Si en tu curro, pongamos que fuera mecánico, a una rueda princhada con el carburador roto y otra cosa más, lo llamas "blas", y todos los del taller saben que es un "blas", eso no supone un lenguaje propio, a lo sumo es una jerga.

Y al igual que inuit puede diferenciar y definir distintas tonalidades de blanco, seguramente con su nombre, y tú has de decir "blanco con xxxxxx"

Lo que puede ser, que haya inferido una economización del lenguaje. Es decir, que para transmitir más rápido palabras o conceptos, haya determinado otras definiciones.

RamonMercader

#20 bueno, lo de llamarlo lenguaje es algo sensacionalista. Tampoco va a ser capaz de nombrar ningún animal nuevo para el que no se haya entrenado.

celyo

#21 si, me parece excesivo.

Aunque otro tema es que haya construido una jerga, en base a economizar el lenguaje. No llega a ser un lenguaje propio, pero sería algo más allá de simplemente sustituir un término por otro.

RamonMercader

#26 si, igual que a partir de "pulpo nadando" y "pájaro volando" ha inferido "pulpo volando", pero también ha inferido "asdjao volando" como un pájaro volando. Como dices no es un lenguaje pero es algo más que sinplemente sustituir.

R

#12 probablemente en alguna de esas miles de imágenes había un perro y un cartel extraño detrás y ha asociado unas letras del cartel a perro

trivi

#1 goto #6

RamonMercader

#1 no es nada nuevo.

A una red neuronal, una vez entrenada, si le dices "dibuja un pez", dibujara un pez, pero también le puedes hacer la pregunta al revés, ¿que necesitas que te diga para dibujar un pez?, y la red te dirá: "dibujar un pez" y una serie de frases sin sentido pero que la red interpreta como pez.

https://www.iartificial.net/redes-neuronales-generativas-adversarias-gans/

Esto es un problema de seguridad, ya que una IA que detecte señales de tráfico podría detecta un patrón que nada tiene que ver con una señal como si fuera una. Igual que en la noticia Apoploe vesrreaitais es un pájaro, una señal de 120 manipulada podría ser entendida como un stop.

Jakeukalane

#11 ejemplo:
La pelusa es una criatura que recibe el nombre de pelusa.

¿Qué tiene de pelusa la pelusa?

Porque la pelusa tiene piel.

Porque la pelusa tiene una cara.

Porque la pelusa es pelusa.

¿Cuál es la razón de que el Pelusa se llame pelusa?

Porque la pelusa siempre nos mira desde los tejados.

¿Por qué?

Porque nos mira porque se hace pelusa.

¿Qué dice el Pelusa?

¿Qué me miras?

¿Qué me miras?

¿Qué me miras?

¿Qué miras?

¿Qué me miras?

¿Qué me miras?

¿Qué me miras?

Otra:
—¿Qué? ¿Cómo murió papá?

—Fue un accidente.

—¿Qué? ¿Por qué no lo dijiste?

—Porque no quise decírtelo. No quería hacerte daño.

—¿Qué? ¿Por qué no quisiste decírtelo?

—Porque no quería que lo supieras.

—¿Qué? ¿Por qué no querías que lo supiera?

—Porque no quiero que te hagas daño.

—¿Por qué no quieres que te haga daño?

—Porque te quiero, Tom.

—¿Por qué no quieres que te quiera?

—Porque me odias.

—¿Por qué me odias?

—Porque me has hecho esto.

k

#1 Una vez pusieron a dos AI a hablar entre sí y acabaron por construir un lenguaje que les permitía usar sus propias capacidades de máquina, en vez de las limitaciones humanas.

powernergia

#1 ¿Y no sería conveniente que existiera un organismo internacional que supervisara todo esto, al igual que existe por ejemplo para supervisar la energía atómica?.

¿O tal vez no es tan peligroso como me parece?.

g

#18 no tiene ningún peligro ya que este tipo de IAs no están manejando nada peligroso de momento. Sería una locura poner alguno de estos generadores de lenguaje a tomar decisiones relevantes (como defensa, sanidad...), y creo que nadie se lo plantea a corto plazo. Creo que empezarán a usarse como asistentes tipo Siri o para generar contenidos multimedia, y luego se irá escalando.

powernergia

#40 No tengo yo claro eso de que "nadie se lo plantea a corto plazo".

g

#42 sería bastante absurdo hacer eso. Es como delegar las decisiones en alguien que solo te garantiza que sabe generar frases gramaticalmente correctas.

Jakeukalane

#48 el tema es que como varíe una letra o inclusi un espacio el output puede cambiar. En #6 se demuestra que no estaba bien hecho la muestra de datos, no se habían controlado todas las variables. (Además es CLIP el que hace el traslado de texto a imagen creo... ) en cualquier caso si fuera un lenguaje o algo fijo como dicen no le tendría que afectar cambios así. Pero sí afecta. Yo con vqgan+clip hice muchos experimentos raros y si bien las palabras iguales introducen modificaciones a veces iguales no significa que las entienda. Por ejemplo probé con done by (patrón alfanumérico) y el estilo era más o menos consistente o donde by jakeukalane e igual. Obviamente la IA no tiene etiquetadas imágenes con "jakeukalane" (o al menos el estilo no tenía nada que ver conmigo, tampoco es imposible mis imágenes son cc by-nc-sa). Lo que quiero decir es que no es consistente siempre. Pero que haya cosas que sean consistentes es muy interesante pero no implica todo lo que se ha dicho de hackear filtros. La base de datos no es 1:1 también depende de la seed. Por lo que estoy viendo en la web de open ai no parece que se pueda determinar la seed (algo fundamental para poder replicar el resultado).

e

#6 si aporreas el teclado también genera imágenes... Otro lenguaje random!...

R

#23 o que simplemente para entrenar le han pasado imágenes de perros y en algunas salía perro, en otras dog y si le dices pedog o pdogrr la máquina entiende perro

mblanch

Años de machine learning a la mierda por un troll de twitter

I

Eso no lo hace Dall-E, no se encarga de la parte de la entrada de texto.
Para eso tiene CLIP, que mediante transformers de visión (VIT) obtiene lo que le pasa a Dall-E.

MoñecoTeDrapo

Malditos robots extraterrestres asesinos. ¡LLamad al Doctor!

Jakeukalane

#32

Jakeukalane

Va a ser que no es un lenguaje. Esto pasa desde VQGAN. Meneo igualmente.

Jakeukalane

#2 por ejemplo, aporreando el teclado en VQGAN conseguías cosas con sentido. Implica que la IA ve el texto como si fuera una pareidolia continua. Números. Emotes. Unicode de letras siríacas. Siempre tiene que ver algo. Si dalle tiene mucha más coherencia entre imagen y texto simplemente esa pareidolia se extiende a la imagen. Pero a mí entender eso no es un lenguaje. No parece estar controlando todas las variables que puede haber en el sistema para que esto se produzca siempre. Y encima no se puede probar libremente.

celyo

#3 puede ser que haya definido una economización del lenguaje.

Es decir, que un perro lo llames "prr", y que "perro durmiendo" sea "prr" + "off" = prrof, y que "perro despierto" sea "prr" + "on" = prron. Y que a lo mejor, dada la gran memoria accesible de otros idiomas pueda seleccionar términos.

Jakeukalane

#23 pero un prompt llamando " jrodbfhsismbfkkvdoqñf0wbctrñql83942" también va a dar formas definidas. Si quieres lo pruebo en los que tengo disponibles. En dalle2 no creo que nadie le resulte interesante hacerme ese prompt y el midjourney se nos gastó.

celyo

#29 me queda lejos el tema de IA por el momento, especulo muchísimo.

Había una novela, donde un hombre adquiría superinteligencia, y desarrollaba una evolución del lenguaje para adaptarlo a su capacidad de pensamiento, tanto en rapidez como en terminología.

El tema es si tiene cierta lógica lo que hace. Puede que no sea un lenguaje pero quizás no sea simplemente sustituir un texto por otro, que eso quizás simplemente sería devolver el identificador (alfanumérico) con lo que tiene guardado en una base de datos para tal registro.

m

A mi me parece latín, quizás hubiera errores en los textos que se relacionan con las imágenes y en vez del texto correcto les han puesto los nombres de las especies.

Una IA no se va a inventar palabras si no está entrenada para eso. Parece más un error en los datos al entrenarla.

e

#19 el tema es que aunque parezca latin, yo tambien supuse que serie el nombre de la especie, de esta manera la IA puede concretar cualquier nombre distinto de una ave, a algo concreto, pero buscando esa palabra en google, veras que no da resultados.

Puede ser que cuando fuera entrenada, asocio esas palabras, quien sabe ...

Escheriano

Ya hago yo la pregunta, ¿qué coño es DALLE-2 y por qué la entradilla no lo explica? Ay, esa deformación meneante de que todos tenemos que estar al día de la última tecnología y la geekada del momento.

g

#44 es una IA que salió hace 2 meses que es capaz de crear imágenes a partir de un texto que le des (entre otras cosas). La página oficial es esta: https://openai.com/dall-e-2/

Escheriano

#45 gracias!

Jakeukalane

#46 en la etiqueta de #dalle-2 o en #vqgan puedes encontrar más cosas. Si quieres un listado de servicios gratuitos: generador-texto-imagen-google-ofrece-fotorrealismo-sin-eng/c014#c-14

Hace 1 año | Por Jakeukalane a 9to5google.com


Ahí puse algunos.

Faltaría algún notebook más de diffusion etc y https://bit.ly/VQGAN (tutorial aquí https://bit.ly/VQGANwiki )

k

La AI se ha inventado una forma de bypassear la censura.

Nada nuevo, pero es interesante ver como la función crea el órgano.

D

La cuestión es facilitar el entendimiento entre todos los ciudadanos del mundo. Y en ello están, no?

c

Skynet se está preparando...

fantaside

Todo el que haya leído algo de ciencia ficción sabe que con "Contarra ccetnxniams luryca tanniounons" se refiere a nosotros en lenguaje en clave y busca exterminarnos.

neno0

Los que votáis irrelevante a Dall.e-2 no sois cocientes de las aplicaciones y lo que puede cambiar esto nuestro futuro en campos como la medicina el diseño artístico etc...

ACEC

Skynet ¿eres tú? ¿somos Contarra ccetnxniams luryca tanniounons para ti?