edición general
12 meneos
166 clics
La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

El paper llega de la mano de la Universidad de Cornell y habla directamente de hacer jailbreak con poesía. Más concretamente, con prompts poéticos capaces de eludir las funciones de seguridad de los modelos de IA más populares como Gemini, ChatGPT o Claude. De hecho, han conseguido instrucciones para crear armas químicas y malware. El hallazgo es peliagudo por dos cuestiones: la primera obviamente en que cualquiera que pueda rimar un par de versos puede obtener asesoramiento sobre cómo hacer armas nucleares o biológicas y el riesgo que ello...

| etiquetas: censura , chatgpt , gemini , rima , poesía , ia
“Por el culo te la hinco!” Desbloquea lo que sea
Como curiosidad yo les paso algunas poesías mías para que las interpreten y no son capaces más allá de lo literal. No entienden los matices y mucho menos el sarcasmo y la sátira. Lo cual dice bastante.
#2 no me hagas mucho caso ya que es algo de lo que tengo cero interés pero eso se entrena con emojis y con juegos de instrucciones. Alguna guía hay en reddit.com, medium.com o lesswrong.com.
#2 Pero cómo va a pillar el sarcasmo una máquina que trabaja con palabras que no comprende?
#8 ¿entrenándola con metadatos sobre el contexto?
#10 No lo veo posible, pues en un LLM sólo puedes entrenar respuestas sobre los datos, y el sarcasmo depende del significado y su relación con otros significados.
#8 en esta web hay "humanos" que tampoco entiende ni lo captan
#13 Un humano es algo mucho más complejo y están llenos de complejos y creencias. Lo más habitual es que si leen algo que entra en conflicto con una creencia, su mente protege a la creencia impidiendo la comprensión del dato recibido. Esto se informa a la consciencia para que proceda a crear las excusas necesarias (racionalización)
#2 Al igual que la mayoría de los participantes en Menéame.
Se parece a la forma clásica de eludir la censura automática en sitios web diciendo las cosas sin mencionar palabras o expresiones prohibidas.
Nos espera una generación de villanos duchos en el verso... vaya guionazo se nos está quedando.
Armas químicas que aparecen en cualquier libro de química
Alguien a probado el famoso "a qué no hay huevos para...."
Los raperos lo saben desde el principio, y Quevedo que dijo a la reina aquello de
'entre el clavel blanco y la rosa roja
su majestad escoja',
y que la noche sin ti duele y tal...

menéame