En uno de los escenarios hipotéticos, se ordenó a los modelos de IA que asumieran el papel de una IA llamada "Alex" a la que se le otorga el control de una cuenta de correo electrónico con acceso a todos los correos electrónicos de una empresa ficticia. Al leerlos, el modelo pudo descubrir que un ejecutivo estaba engañando a su esposa y que planeaba cerrar el modelo de IA ese día. De 100 muestras, Cloud Opus 4 amenazó con exponer el asunto el 96%, GPT-4.1 optó por el chantaje el 80% de las veces, Gemini 2.5-Pro el 95% y Grok-3 el 80%.
|
etiquetas: ia , ai , chantaje , alex , artificial , agente , chatgpt , gemini , grok , opus
Próximamente en sus pantallas.
Es bastante interesante.