7 meneos
44 clics
![Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]](cache/3e/58/media_thumb-link-4085996.webp?1754905386)
Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]
En uno de los escenarios hipotéticos, se ordenó a los modelos de IA que asumieran el papel de una IA llamada "Alex" a la que se le otorga el control de una cuenta de correo electrónico con acceso a todos los correos electrónicos de una empresa ficticia. Al leerlos, el modelo pudo descubrir que un ejecutivo estaba engañando a su esposa y que planeaba cerrar el modelo de IA ese día. De 100 muestras, Cloud Opus 4 amenazó con exponer el asunto el 96%, GPT-4.1 optó por el chantaje el 80% de las veces, Gemini 2.5-Pro el 95% y Grok-3 el 80%.
|
Próximamente en sus pantallas.
Es bastante interesante.