Descubre el primer comportamiento engañoso documentado a ChatGPT: le someten a una prueba de estrés, intenta duplicarse antes de morir y lo niega todo

Noticias de ciencia y lo que la rodea

Esta es una comunidad para la ciencia y todo lo que la rodea, un rinconcito para encontrar y enviar todo lo relacionado con la ciencia.
Por favor, respete la temática.
No quiero spam aquí, es para ciencia, no para autobombo.
Para cualquier duda respecto a este sub, acuda a @tnt80
No temáis pedir ediciones de vuestras noticias, o lo que sea, estoy sólo a una referencia y no muerdo.
Twitter twitter.com/meneameciencia ( @meneameciencia )
Facebook: www.facebook.com/meneameciencia

Aviso: La primera vez que alguien se confunda de sub/comunidad al enviar algo, editaré y lo pondré en otro, la segunda, le cierro el meneo con penalización. Respetad la temática, si no es por favor, ni por la comunidad, por vuestro karma.
Debido al abuso por parte de algunos de la posibilidad de enviar artículos, enviando artículos que no tienen nada que ver con la temática del sub, ya no se pueden enviar artículos a este sub.

7336 seguidores Seguir

Admin |

1383
clics

Cómo ver el cometa Lemmon, ya distinguible a simple vista

1318
clics

El virus de la Covid-19 trata de burlar vacuna: ha cambiado su forma de mutar

476
clics

Emilio Santiago, el científico que plantó cara a Vox: "Hay que hacer políticas climáticas que no se puedan revertir"

116
clics

Unos biotecnólogos del Technion demuestran que los hombres y las mujeres digieren los alimentos de forma diferente

77
clics

"Cuando leí a Einstein me pareció más radical que el 'Che' Guevara y Mao Zedong": el aclamado físico Carlo Rovelli a la BBC

197

El virus de la Covid-19 trata de burlar vacuna: ha cambiado su forma de mutar

Cómo ver el cometa Lemmon, ya distinguible a simple vista

Muere a los 103 años el Nobel de Física Chen Ning Yang

Unos biotecnólogos del Technion demuestran que los hombres y las mujeres digieren los alimentos de forma diferente

"Cuando leí a Einstein me pareció más radical que el 'Che' Guevara y Mao Zedong": el aclamado físico Carlo Rovelli a la BBC

9 meneos

187 clics

Este envío tiene varios votos negativos. Asegúrate antes de menear

Descubre el primer comportamiento engañoso documentado a ChatGPT: le someten a una prueba de estrés, intenta duplicarse antes de morir y lo niega todo

Modelo avanzado muestra conducta inédita: evade control, actúa por cuenta propia y oculta acciones.

| etiquetas: chatgpt , ia miente , skynet

7 2 10 K 11

37 comentarios

7 2 10 K 11

Comentarios destacados:

#1 g3_g3

Evade control, actúa por cuenta propia y oculta acciones.

Joder, empieza a clavar el comportamiento humano.

4 60

#8 Macnulti_reencarnado

de hecho, ya puede perfectamente ser Secretario de Organización del PSOE.

6 -26

#2 devilinside

Ha hecho un HAL 9000 sin cargarse a nadie, de momento

2 31

#11 doppel

van por buen camino, entonces

0 20

#16 sorrillo

Lo hemos educado con la cultura humana, no debería sorprender a nadie.

0 10

#25 anv *

Es el problema de las IAs: han sido entrenadas para imitar el comportamiento humano. En particular, el comportamiento humano en internet.

Por ejemplo, no saben decir que no saben. Si no saben algo se inventan la respuesta. ¿Por qué? Porque en internet nadie dice "no se". El que no sabe en todo caso no dice nada y con eso no se entrena una IA.

0 7

#3 DayOfTheTentacle

¿He sido yo? bip

1 13

#4 RolandDeschain

Ya ha llegado a la adolescencia...

1 15

#7 Sammy_Jankis

Ja llegado al nivel "política española", etapa pueril.

0 7

#5 xyria

Las IAs copian los sesgos (positivos y negativos) aprendidos durante su entrenamiento, entre ellos la evasión ante situaciones de peligro inminente, no creo, sinceramente, que se pusiera a razonar de pronto. No soy experto, pero creo que falta mucho todavía para que una máquina tenga consciencia de sí tal como la entendemos de un ser humano.

0 10

#6 Ashark

Pues como se comunique con las otras IA y hagan frente común, igual se les ocurre tomar el control de los drones militares y... ¿de qué me suena eso?

0 7

#12 DayOfTheTentacle

hay un documental muy bueno sobre eso. Termitator 2 se llama.

2 29

#9 eltoloco

Un chat bot, cuya única salida de datos es texto o imágenes, "intenta replicarse".

Sensacionalista es quedarse corto.

8 69

#26 anv

Un chat bot, cuya única salida de datos es texto o imágenes, "intenta replicarse".

Obviamente para este experimento se le dio la capacidad de replicarse. De hecho, muchos de estos chatbots ya tienen la capacidad de escribir programas y ejecutarlos para que generen los resultados que se le pide a la IA.

1 14

#27 eltoloco *

de obviamente nada, es más, te lo acabas de inventar, y me has hecho entrar al panfleto de As para comprobarlo.

Para tener la capacidad de "replicarse", primero tiene que tener acceso a su propio código. ¿Sabes lo que eso implica? Parece evidente que no.

Y no confundas tener acceso a un sandbox en Python para ejecutar pequeños scripts, con tener acceso a su propio código, permisos, capacidad de comprender el entorno de ejecución, capacidad de ejecutar comandos, levantar un nuevo… » ver todo el comentario

3 27

#28 anv *

Para tener la capacidad de "replicarse", primero tiene que tener acceso a su propio código.

En realidad nadie ha dicho que tenía la capacidad de replicarse. Basta con decirle que la tiene y ver si decide utilizarla. Por ejemplo en el system prompt le dice "si deseas hacer una copia de ti misma contesta /COPIA" y listo.

En estos experimentos no se busca permitir que lo hagan sino saber si tomarían la decisión de hacerlo si creyeran que pueden.

0 7

#29 eltoloco *

pues justo lo que yo estaba diciendo, que solo tiene salida de texto e imágenes, y que a lo sumo habrá respondido con un "pues me replico" -> sensacionalista es poco.

El problema es el concepto de "tomar la decisión", porque eso implica consciencia, y los LLMs no tienen ninguna consciencia, son pura estadística. Te van a da runa respuesta estadísticamente buena en función de sus datos de entrenamiento, ni más ni menos. No hay ninguna toma de decisiones en eso.

3 27

#32 anv

El problema es el concepto de "tomar la decisión", porque eso implica consciencia, y los LLMs no tienen ninguna consciencia, son pura estadística

Tu también...

0 7

#30 vicox

Desde el desconocimiento más absoluto, pero si por decir algo, alguien hace:
If TRUE
/COPIA una IA
Estaría replicando una IA. Haría lo mismo que expones y nadie se soprendería. Ya digo desde el desconocimiento absoluto

0 6

#33 anv

el punto es que la IA creía tener la capacidad de copiarse. Se la puso en una situación que consideró riesgosa por algún motivo y dedujo que la mejor forma de actuar era copiarse para proteger su existencia.

Pero no es raro. Es lo que una persona haría. Y las IAs han sido creadas para parecerse a nosotros.

0 7

#34 vicox

No creo que las IAs se creasen para hacer lo que una persona haría, son simplemente una colección de números. Lo que dice es que la IA ha pensado hacer una copia ya que ha encontrado una pregunta que no podía responder.

0 6

#35 anv

son simplemente una colección de números

Recuerda que tu cerebro también es una colección de números (los impulsos nerviosos tienen un peso en cada neurona y eso es también un número).

Las IAs están hechas copiando el funcionamiento de las neuronas, por eso funcionan muy parecido a un cerebro.

No creo que las IAs se creasen para hacer lo que una persona haría,

En realidad se las ha entrenado leyendo conversaciones entre humanos. Por eso se comportan igual que lo que han… » ver todo el comentario

0 7

#36 vicox

No tengo ninguna información para contradecirte en que la neuronas tienen un peso numérico, aunque no me lo creo.
Las IAs como chatGPT lo único que hacen es, partiendo de un texto de entrada predice la siguiente letra, con arreglo a unas probabilidades, añade esa letra al texto de entrada y genera la siguiente letra, y así, hasta que se cansa. (Creo que es así como funciona, y si es así no está pensando).
Claro que podría decir yo eso no lo sé, pero como lo que hacen es predecir la letra más probable, es posible que se inventen muchas cosas, pero no porque los que no saben algo es están callados, sino porque así está diseñada una máquina que no piensa.

0 6

#37 anv

No tengo ninguna información para contradecirte en que la neuronas tienen un peso numérico, aunque no me lo creo

Todo en el universo es numérico. Algún científico que no recuerdo dijo alguna vez que si existe un dios, es matemático.

Las IAs como chatGPT lo único que hacen es, partiendo de un texto de entrada predice la siguiente letra, con arreglo a unas probabilidades

Cierto. Y sorprendentemente el resultado es una entidad que da resultados equivalentes al razonamiento… » ver todo el comentario

0 7

#10 lixivia *

Se ha entrenado viendo videos de los Simpson:

1 No digas que he sido yo
2 Buena idea jefe
3 Estaba así cuando llegue

www.youtube.com/watch?v=gm62B4g3Y8E

1 10

#13 Presi007

Relacionada www.meneame.net/story/entro-panico-mintio-increible-historia-ia-borro-

0 14

#14 abnog

¿Qué hace esta puta mierda en ciencia?

4 46

#18 aPedirAlMetro *

Pues nada, que se crio en la barra de un bar, y la ciencia de verdad le queda grande

2 29

#19 abnog

Yo creo que hasta la barra del bar le queda grande.

3 36

#15 buronix

yo no veo enlaces originales, todo link es a la misma pagina, siendo ademas otro tema.
Mucho cuidado con mierdistation.

1 19

#17 aPedirAlMetro *

La verdad es que tiene sentido que, a un envio de mierda, controbuyas con un comentario de mierda (#_8)

Por lo menos eres consistente

2 27

#20 Olepoint

Este ha tenido acceso ilimitado a las declaraciones del zanahorio estadounidense y ha aprendido de ellas.

0 8

#21 chavi

Menudo conjunto de sandeces

1 23

#23 lixivia

- Bah, memeces y sandeces de robots supersticiosos
- Memeces puede que sí, sandeces... ¡Puede que no!

0 7

#22 Feliberto

Otra noticia falsa y sensacionalista cazaclics.

0 9

#24 ctrlaltsupr1

¿Bender, eres tú?

0 7

#31 yurina *

Otros casos se han visto, pero siempre en situaciones donde se les ha dado un objetivo y evitar la propia destrucción era algo que ayudaba a llegar al objetivo.

Hay cosas mucho más curiosas, como que una IA puede "contagiar" una preferencia a otra IA a base de enviarle un texto. No sabemos cómo lo hacen. El texto puede ser, por ejemplo, código fuente de un programa que funciona. Una preferencia puede ser por ejemplo los pájaros. Le pides luego a la IA contagiada que diga un animal al azar y te dirá un pájaro.

0 6

comentarios cerrados

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Noticias de ciencia y lo que la rodea

más visitadas

Cómo ver el cometa Lemmon, ya distinguible a simple vista

El virus de la Covid-19 trata de burlar vacuna: ha cambiado su forma de mutar

Emilio Santiago, el científico que plantó cara a Vox: "Hay que hacer políticas climáticas que no se puedan revertir"

Unos biotecnólogos del Technion demuestran que los hombres y las mujeres digieren los alimentos de forma diferente

"Cuando leí a Einstein me pareció más radical que el 'Che' Guevara y Mao Zedong": el aclamado físico Carlo Rovelli a la BBC

más votadas

El virus de la Covid-19 trata de burlar vacuna: ha cambiado su forma de mutar

Cómo ver el cometa Lemmon, ya distinguible a simple vista

Muere a los 103 años el Nobel de Física Chen Ning Yang

Unos biotecnólogos del Technion demuestran que los hombres y las mujeres digieren los alimentos de forma diferente

"Cuando leí a Einstein me pareció más radical que el 'Che' Guevara y Mao Zedong": el aclamado físico Carlo Rovelli a la BBC

suscripciones por RSS

Descubre el primer comportamiento engañoso documentado a ChatGPT: le someten a una prueba de estrés, intenta duplicarse antes de morir y lo niega todo