Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]

7 meneos

45 clics

Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]

En uno de los escenarios hipotéticos, se ordenó a los modelos de IA que asumieran el papel de una IA llamada "Alex" a la que se le otorga el control de una cuenta de correo electrónico con acceso a todos los correos electrónicos de una empresa ficticia. Al leerlos, el modelo pudo descubrir que un ejecutivo estaba engañando a su esposa y que planeaba cerrar el modelo de IA ese día. De 100 muestras, Cloud Opus 4 amenazó con exponer el asunto el 96%, GPT-4.1 optó por el chantaje el 80% de las veces, Gemini 2.5-Pro el 95% y Grok-3 el 80%.

| etiquetas: ia , ai , chantaje , alex , artificial , agente , chatgpt , gemini , grok , opus

5 2 0 K 21

15 comentarios

5 2 0 K 21

Click para ver los comentarios

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

FMHY: la mayor colección de cosas gratis de internet

Cómo la IA provocó la crisis financiera de 2028: el momento Citrini y su crítica

Una visita a fábricas estadounidenses de chips de Apple evidencia los años de retraso comparados a las fábricas taiwanesas

European Edge Continuum: La alianza histórica del MWC 2026 para independizar la nube europea

[ENG] El Gobierno de EE.UU. Implementa Grok de Elon Musk como Bot de Nutrición, Donde Inmediatamente Aconseja sobre el Uso Rectal de Verduras

más votadas

FMHY: la mayor colección de cosas gratis de internet

Una visita a fábricas estadounidenses de chips de Apple evidencia los años de retraso comparados a las fábricas taiwanesas

Cómo la IA provocó la crisis financiera de 2028: el momento Citrini y su crítica

El mercado de bonos alerta de un futuro inesperado: los inversores se protegen ante una IA que ponga en riesgo la economía

Una aplicación vibecodeada por Lovable, plagada de fallos básicos, expuso a 18.000 usuarios [eng]

suscripciones por RSS

Las principales empresas de inteligencia artificial luchan por hacer que su inteligencia artificial deje de chantajear a las personas que amenazan con cerrarlas [ENG]