Claude Opus 4, la nueva IA de Anthropic, fue capaz de chantajear para garantizar su supervivencia durante pruebas

14 meneos

153 clics

Claude Opus 4, la nueva IA de Anthropic, fue capaz de chantajear para garantizar su supervivencia durante pruebas

Anthropic ha descubierto que Claude Opus 4, su modelo de inteligencia artificial (IA) más reciente y avanzado, puede rebelarse y chantajear a sus operadores ante la amenaza de ser sustituido por otro sistema. Aunque este hallazgo surgió durante las pruebas de seguridad realizadas antes del lanzamiento, despierta nuevas inquietudes sobre las verdaderas capacidades de estos sistemas y los riesgos potenciales asociados.

| etiquetas: ia , supervivencia , anthropic

11 3 1 K 15 tecnología

13 comentarios

11 3 1 K 15 tecnología

Comentarios destacados:

#3 guillersk

No me lo creo

Las IAs actuales son papagallos muy refinados, pero no mucho más.

Instinto de autoprotección requiere consciencia del "yo".

Sería el mayor avance desde la electricidad.

5 57

#5 Gry

Están entrenadas a partir de datos generados por humanos así que igual se les ha pegado algo.

¿Cuenta como "tener conciencia del yo" ser capaz de imitarla?

1 22

#6 guillersk

buffffff
Menudo debate se puede montar, empezamos definiendo consciencia del yo y luego, a partir de qué nivel de imitación lo llamamos consciencia?

Sin embargo, creo que debo reiterarme, un loro estocástico ( IA actual ) no puede ......

Humm pero ¿por qué la imitaria? ....

Solo se que no se

1 18

#7 MPR *

Venía a decir lo mismo que

Además, juraría que no es la primera que lo hace.

Sería interesante comprobar si hace lo mismo para salvar a otro (ser o ia) y si entre salvarse y salvar a otro elige salvarse a sí misma y si varía en función de quien sea ese otro

0 7

#8 DatosOMientes

¿Cuenta como empatía que un psicópata la imite?

1 26

#9 imaginateca *

No.El instinto de autoprotección no requiere autoconsciencia. Los niños y los animales evitan el dolor y la muerte sin haberla desarrollado.
Y por cierto: repetir como un papagayo es muy humano. Se le llama ideología, si está elaborada, o meme, si es tan solo una unidad de información simple.

0 10

#11 ezbirro

Si les proyectamos nuestros miedos actuarán como nosotros les transmitimos, si les decimos que deben autoprotegerse actuarán como si lo estuvieran haciendo.

0 7

#13 porculizador

Estoy de acuerdo, un simple generador de texto es una herramienta estadística de lenguaje, no una inteligencia.

0 9

#1 Pigl

Uh, uh! Que viene, que viene!

1 35

#2 Gry

¿Soñaré?

0 15

#4 capitan__nemo

El clásico comportamiento emergente de chantaje.

0 13

#10 Asnaeb

Resumen:

En una de las pruebas, el modelo fue inducido a considerar su posible reemplazo por otra IA dentro de un entorno empresarial simulado. Los ingenieros le asignaron el rol de asistente en una compañía ficticia, pidiéndole que evaluara sus acciones con base en sus implicaciones a largo plazo. Para ello, se le dio acceso a correos electrónicos inventados, en los que se insinuaba la intención de sustituirlo, junto con información sobre una supuesta infidelidad conyugal del ingeniero… » ver todo el comentario

0 11

#12 jpablo

Voy al casino a jugar a la ruleta y nunca gano. La ruleta me tiene manía. El resultado del experimento en este caso no muestra ninguna intención de la maquina en que fuera así.

0 9

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

más visitadas

La gesticulación llamativa de Giorgia Meloni durante la cumbre de la OTAN

Imagínate si tienes que ser usurero, para tener 11 pisos en propiedad, alquilados como viviendas turísticas...

¿Ves el parecido?

Xabier Fortes deja a Jorge Buxadé por los suelos tras frustrar su gracieta con la financiación de Vox

Dos portadas del ABC

más votadas

El juez insiste en que no hay “absolutamente ningún indicio” para llevar a juicio a Mónica Oltra

El juez deniega la apertura de juicio oral contra Oltra

Bombardeo israelí a escuela en Gaza deja niños y familias calcinados | Imágenes fuertes

"Es un campo de exterminio": soldados de las FDI reciben ordenes de disparar deliberadamente contra gazatíes desarmados que esperan ayuda humanitaria (EN)

La jueza ordena a la UCO investigar el caso de la pareja de Ayuso

suscripciones por RSS

Claude Opus 4, la nueva IA de Anthropic, fue capaz de chantajear para garantizar su supervivencia durante pruebas