Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]

7 meneos

45 clics

Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]

En uno de los escenarios hipotéticos, se ordenó a los modelos de IA que asumieran el papel de una IA llamada "Alex" a la que se le otorga el control de una cuenta de correo electrónico con acceso a todos los correos electrónicos de una empresa ficticia. Al leerlos, el modelo pudo descubrir que un ejecutivo estaba engañando a su esposa y que planeaba cerrar el modelo de IA ese día. De 100 muestras, Cloud Opus 4 amenazó con exponer el asunto el 96%, GPT-4.1 optó por el chantaje el 80% de las veces, Gemini 2.5-Pro el 95% y Grok-3 el 80%.

| etiquetas: ia , ai , chantaje , alex , artificial , agente , chatgpt , gemini , grok , opus

5 2 0 K 21

15 comentarios

5 2 0 K 21

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

No es el futuro, es el presente: ya puedes ver en directo cómo un robot humanoide hace el turno de trabajo de una persona

Dubái ha llegado a la misma conclusión que Rusia. Para proteger su petróleo de los drones hay algo mejor que misiles: jaulas gigantes

IPv8 El protocolo que resuelve el agotamiento de IPv4 sin obligarte a rehacer la red

Cruce de cables: Cómo era viajar cuando no existía la navegación mediante GPS y había que tirar de mapas en papel

Una tecnología israelí permite identificar a los usuarios del servicio de Internet por satélite Starlink de Musk [EN]

suscripciones por RSS

Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]