La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

128 meneos

1576 clics

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación

El paper llega de la mano de la Universidad de Cornell y habla directamente de hacer jailbreak con poesía. Más concretamente, con prompts poéticos capaces de eludir las funciones de seguridad de los modelos de IA más populares como Gemini, ChatGPT o Claude. De hecho, han conseguido instrucciones para crear armas químicas y malware. El hallazgo es peliagudo por dos cuestiones: la primera obviamente en que cualquiera que pueda rimar un par de versos puede obtener asesoramiento sobre cómo hacer armas nucleares o biológicas y el riesgo que ello...

43 85 0 K 403 tecnología

85 comentarios

43 85 0 K 403 tecnología

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

edición general

más visitadas

Inquiokupas

El deficiente sistema de ocultación en algunos documentos del 23F desclasificados permite conocer el texto tapado

El aficionado del Real Madrid expulsado por hacer el saludo nazi: "Tengo dos negros adoptados"

Abro comunidad de Ciencia ficción en Menéame (y de paso recomiendo enlaces al respecto)

Un rico heredero nos da las claves para ganar dinero

más votadas

La matriz alemana de Quirónsalud celebra que su negocio en España crece un 11%, tras un pago de casi 500 millones del Gobierno de Ayuso

La fiesta de los directivos de Acciona con los concejales del PP antes de llevarse un contrato de 2,4 millones

Refugiado ciego encontrado muerto en la calle después de que la Patrulla Fronteriza estadounidense lo dejara a kilómetros de su casa [ENG]

Israel empuja a un éxodo al último pueblo cristiano de Cisjordania

Los alumnos acusados de violar a una compañera en Valencia regresan al instituto del que fueron expulsados tras marcharse ella a otro centro

suscripciones por RSS

La censura de ChatGPT y Gemini se termina cuando entra en juego la rima, según una investigación