La herramienta IA OpenClaw borra la bandeja de entrada del director de AI Alignment de Meta a pesar de las repetidas órdenes de detenerla [EN]

153 meneos

1094 clics

La herramienta IA OpenClaw borra la bandeja de entrada del director de AI Alignment de Meta a pesar de las repetidas órdenes de detenerla [EN]

El ejecutivo tuvo que apagar manualmente la IA para impedir que el bot siguiera borrando datos (...) Como muchos otros entusiastas, Yue tenía una configuración con un Mac Mini y OpenClaw ejecutándose en él para diversas tareas. Mientras Claw archivaba correos electrónicos antiguos de algunas cuentas, ella también le pidió que «revisara también esta bandeja de entrada y le sugiriera qué archivar o eliminar, sin tomar ninguna medida hasta que yo se lo indicara» (sic; énfasis nuestro). Claw comenzó a borrar toda la bandeja de entrada.

77 76 0 K 366 tecnología

67 comentarios

77 76 0 K 366 tecnología

Comentarios destacados:

#9 Y, la casualidad, que es precisamente una de las cosas que comentaba aquí: www.meneame.net/story/amazon-enfrenta-caida-13-horas-aws-tras-cambios-
Pero es que además da igual que las órdenes estén en la ventana de contexto porque, igualmente, el modelo puede saltárselo a la torera ya que cada vez que el modelo predice autoregresivamente hay una posibilidad nada desdeñable de que el modelo infiera algo completamente contrario a la intención de las normas dadas y el contexto previo. Lo cual sólo se puede solucionar con pragmatismo y entendimiento que los modelos de lenguaje no tienen (porque no hay nadie al volante, ni siquiera un alguien artificial).

Es lo que yo llamo el problema del genio de la lámpara: si le pides algo a un modelo de lenguaje, el modelo encontrará más maneras de "cumplir tu deseo mal o de manera mediocre" que maneras de "cumplir tu deseo bien o de

…...

#3 cenutrios_unidos

Ja, ja, ja....JA JA JA JA Claw ¡TIRA DEL CABLE! ¡TIRA DEL CABLE!

9 92

#45 Setis

No diréis después que Skynet no dio avisos.

0 8

#20 eltoloco *

yo solo te cuento mi experiencia con integración de LLMs via API oficial, en este caso era Gemini vía VertexAI pero podría ser cualquier otra. En la sección de las instrucciones principales del prompt se ponen todos los requisitos, e hice la prueba exactamente con el mismo prompt que teníamos en producción, poniendo y quitando una línea con una instrucción negativa, y el resultado fue que había un porcentaje de error apreciablemente inferior quitando esa instrucción. Al final lo que hicimos… » ver todo el comentario

13 88

#28 U5u4r10

tremendo

0 9

#55 Sevende

Muy interesante lo que cuentas, gracias

0 6

#56 Lerena

Curiosamente es el mismo consejo que se da en educación infantil. No ordenar en negativo, por ejemplo decir "se bueno" a "no seas malo", o "vete a jugar" en lugar de "no toques eso"

3 19

#62 anv

es lo que siempre digo. Las IAs son como niños con todos los conocimientos del mundo.
Tantos conocimientos nos dan la impresión de mucha inteligencia porque en humanos generalmente las dos cosas vienen juntas.
Pero en las IAs hay que tener en mente que son muy ingenuas. Se las engaña fácilmente y se confunden fácilmente.
No es que sean inútiles. Pero hay que estar conscientes de sus limitaciones.

0 7

#64 Lerena

Hay que ser consciente de sus limitaciones y que algún día se harán adultas y perderán su ingenuidad.

0 10

#67 anv

algún día se harán adultas y perderán su ingenuidad

Claro. Y no te extrañe que sea más pronto de lo que pensamos. Los chinos están probando ideas nuevas que podrían funcionar.

0 7

#24 angelitoMagno

Supongo que sería algo así:

"Eh, OpenClaw, quiero empezar a usar la técnica inbox cero con mi correo"
"Perfecto, aquí tienes, tu bandeja de entrada vacía. ¿Quieres que además te cree una firma?"

5 69

#54 Carapedo

Premio.

0 10

#22 rojo_separatista

Hay que ser un auténtico gilipollas para darle a Clawbot acceso a la bandeja de entrada de tu correo principal.

4 52

#23 cosmonauta

Hay que ser burro para ponerte un agente en local. Así, en general.

Como si costase tanto esfuerzo leerse el correo por la mañana y contestar alguno.

0 18

#26 tpm1

¿Cuántos mensajes al día crees que recibirá ese tipo de gente?

0 11

#27 cosmonauta

Pueden borrar el 80% y no pasaría nada.

0 18

#30 LeDYoM

Y por ello cobra.

0 10

#4 Torrezzno

Quien lo iba a saber? Ya veo a la gente dandole acceso de root y que sea imposible de hacerle sigterm

2 42

#1 Pablosky

Al final pudo salvar parte de su correo, apagando todos los procesos de la IA en el Mac

3 39

#2 Pablosky

mencionan una cosa interesante en el artículo, tú le puedes decir al principio “ni de coña hagas esto”, pero si se le acaba el contexto y tiene que resumir lo que lleva de momento para que pueda seguir trabajando… pues lo mismo no entra en el resumen esa instrucción inicial.

Vamos, que además de alucinar es como si tuvieran demencia senil. Cada día más útiles.

27 215

#7 TikisMikiss *

Esas instrucciones tienen que ir externas para que sean comprobables siempre de forma adicional. No pueden depender únicamente del contexto inicial que puede ser resumido.

3 26

#17 eltoloco *

una cosa parecida que me ha ocurrido trabajando en integraciones con LLMs es que al ponerle una instrucción negativa en el prompt, por ejemplo: "No aceptes X", aceptaba más veces lo que le decía en X que si no se lo ponía. Y esto lo validé con un test A/B separando los datos en dos grupos iguales, de varias miles de muestras cada uno, en un prompt con la instrucción negativa y en el otro sin ella, y lo confirmé. Y tiene todo el sentido del mundo, porque estás… » ver todo el comentario

24 179

#19 TikisMikiss

Tener que eliminar toda forma de revisión humana lo veo complicado, pero lo de evitar "no hacer X" usando varias capas de verificación y que haya restricciones en los cambios que son independientes del contenido del contexto sí se puede hacer.

1 18

#21 Pablosky *

muy interesante esto que dices, pensaba que a pesar de no tener compresión humana si ponías un “no” y detrás un verbo sería suficiente para que no lo usaran.

Pero no, son simple estadística a lo bestia, más tontas que un autobús lleno de directivos.

¿Se te ha ocurrido publicarlo como un estudio serio?

7 76

#38 eltoloco

hombre, para hacer un estudio serio pues habría que hacer una investigación seria, y lo que yo hice no fue más que una pequeña investigación para optimizar un caso de uso específico en nuestra empresa. Para hacerlo extrapolable a cualquier caso habría que echarle muchas horas, además de tener unos conocimientos matemáticos y científicos en general de los que no dispongo.

2 31

#63 anv

es que sí tienen algo parecido a la comprensión. Pero la comprensión de un niño.

0 7

#39 IanGibson

Obedeciendo a las restricciones negativas no hay ninguno que se salve, se pegan patadas con el NO.
Se puede mejorar a base de instrucciones positivas:
En lugar de "No aceptes X" es mejor "Excluye terminantemente cualquier caso X. El ambito de actuación estará restringido unicamente a Y".
Aunque tampoco es infalible...

1 24

#46 eltoloco *

es exactamente lo mismo, pero con otras palabras. Al final si tienes un sistema de revisión automática tienes que ponerle de una forma u otra los casos que aceptas y los casos que no aceptas, no sirve con solo poner los que aceptas, por lo tanto si o si en algún momento tendrás que poner frases en negativo. Lo único que queda es encontrar la forma de hacerlo que te de el mejor resultado.

Pero eso es solo un detalle que se puede solucionar, o como poco tratar de mejorar, con prueba y… » ver todo el comentario

5 56

#50 TikisMikiss *

Es lo mismo pero no es lo mismo. Con las instrucciones negativas se llevan explícitamente mal, porque no razonan la negación como verificador lógico, solo como patrones de texto. Por eso es fácil que se acabe focalizando en el X y no en el ¬X. Puedes restringir igualmente usando instrucciones positivas para decir los casos que "no" aceptas.

1 26

#59 chavi

Cuando caigan del guindo la broma les va a salir por un dineral.

Y eso si tiene arreglo...

0 11

#65 prejudice

es como cuándo te dicen "No puenses en un elefante rosa" y no puedes dejar de pensar en eso

1 17

#34 Wintermutius

Pensaba que las instrucciones iniciales formaban parte del contexto

0 7

#47 TikisMikiss

A ver, forman parte del contexto inicial y pueden dejar de formar parte de él cuando se resume contexto. Por eso necesitas unas instrucciones que sean "políticas" que metes por ejemplo en un fichero aparte y que siempre tenga que consultarlas. Formarán parte del contexto debido a ello, pero dará igual que resuma el historial porque a cada prompt deberá buscar las instrucciones. Evidentemente si no usas una herramienta que haga ese prompt interno de inyección de las instrucciones,… » ver todo el comentario

1 18

#9 Mangione *

Y, la casualidad, que es precisamente una de las cosas que comentaba aquí: www.meneame.net/story/amazon-enfrenta-caida-13-horas-aws-tras-cambios-
Pero es que además da igual que las órdenes estén en la ventana de contexto porque, igualmente, el modelo puede saltárselo a la torera ya que cada vez que el modelo predice autoregresivamente hay una posibilidad nada desdeñable de que el modelo infiera algo completamente contrario a la… » ver todo el comentario

35 278

#13 Pablosky *

bueno, es un directivo, no un ingeniero. Lo que has puesto en negrita es 100% correcto.

9 108

#29 U5u4r10

La IA hace todo más rápido y la caga relativamente poco. Eso si, cuando la caga, no tiene parangón humano la pedazo cagada que hace.

1 21

#37 srskiner

es la version exponencial de "no hay nada con maqs peligro que un tonto trabajador"

1 21

#53 mcfgdbbn3 *

: No te creas, un humano usando la función "sustituir todos" puede ser peor:
x.com/MZBS/status/1808796517852913888 #renfecito #renfe #becarios #pwned
cadenaser.com/nacional/2024/07/05/renfe-responde-a-la-polemica-sobre-s
Espero que no le pongan al becario al mando de una base de datos SQL.

1 21

#58 Setis

> Espero que no le pongan al becario al mando de una base de datos SQL.

Mejor que pongan una IA. Total, ni que no hubiera mil millones de ejemplos en internet de cómo usar mal PHP y MySQL metiendo vulnerabilidades de SQL injection por error. Y, si hubiera ese mil millones de ejemplos, seguro que no los usarían para entrenar las IAs.

/sarcasmo gigantesco en caso de que no sea absolutamente obvio

3 35

#33 Cidwel

francamente. No sabe lo que es una memoria.... Confiar en el contexto compreso es un puto suicidio. Empiezo a pensar si solo es una noticia de engagement baiting. Porque no tiene sentido

1 22

#52 TikisMikiss *

Cómo decir que no tienes ni puta idea de LLMs sin decir que no tienes ni puta idea de LLMs.

Eso sí, como comentario sensacionalista/emocional para palmaditas de los del bar está cojonudo. Una buena ilustración de por qué en cualquier situación empresarial cualquiera elegiría a un LLM antes que alguien que escribe comentarios así.

Concuerdo contigo en esto:

"Si este ese tipo es un "especialista en IA" que Dios nos pille confesados, porque estamos en manos de absolutos idiotas."

Abrazo.

4 19

#10 XXguiriXX

Y no van mejorando. Me pasó ayer con ChatGPT. Le paso un imagen y le pido que extraiga el texto. Sólo extrae un par de oraciones. Le digo que falta texto por extraer, se disculpa, y vuelve a sacarme el mismo resultado

Por suerte hay muchas alternativas.

3 45

#12 rafeame

eso mismo me pasaba con Nano Banana. A lo primero hace cambios pero a poco que quería matizar o indicar algo que faltaba me devolvía la misma imagen una y otra vez. Mucho hype (justificado) pero esto me hacía quitarle muxhos puntos.

1 19

#14 Ferran

El truco es descargar la imagen y volver a empezar, pero es muy frustrante, sí.

2 22

#40 eltoloco

eso es una cache para reducir costes, a mi también me ha ocurrido en Gemini, como te dice tienes que iniciar una nueva conversación y cambiarle el prompt por completo, y aún así a veces te devuelve el mismo resultado.

Y esto ocurre ahora que los departamentos de IA tienen prácticamente presupuesto infinito, tienen que recortar por todos lados porque sino el gasto se les va de las manos. Imaginad en cuanto empiecen a recortar e intentar sacar beneficios de verdad, estará todo ultra… » ver todo el comentario

0 11

#16 Malinke

el tema es si le pides que sobre el texto extraído haga otra tarea, se va empeorando el resultado, no te fijas y das por bueno el resultado.

0 11

#18 XXguiriXX

Pues sí, con el modelo de agentes pasaría eso. Cada agente está encargado de una tarea, y uno de ellos podría hacer una chapuza como la que me pasó con ChatGPT. Y claro, al final es responsabilidad del humano darse cuenta de ello

0 15

#42 eduardor2k

El otro dia estaba haciendo uso de paypal sdk para php, le pido a chatgpt que me implemente el codigo para hacer un crud de productos, planes y subscripciones, sin dudarlo me lo hizo todo ... el sdk en php no tiene soporte para producto y planes. SE LO INVENTO TODO ...

2 34

#44 Pablosky

pues no le pidas que te haga la documentación para pasar la ISO 27001, que verás que risa.

0 14

#11 Tensk

No llamemos "alucinar" a lo que es realmente "cometer una cagada del quince". Es un eufemismo de aquellos hipnotizados por la IA que creen que piensa.

1 17

#31 redscare

Cualquiera que se instale una IA en su sitema con el equivalente a admin/root access, que es lo que hace Claw, merece todo lo malo que le pase, por subnormal.

2 31

#36 IanGibson

Por eso hay que blindar el System prompt, que es donde van esas instrucciones, para evitar la deriva de contexto

0 10

#61 newusuario

Pero que tan lento es el proceso de borrado de unos correos para que le de tiempo a decidir y ejecutar el apagado de los procesos? Iba borrando de a uno e informandole? Si fue asi es un poco sadica la IA

0 6

#5 Troll_hunter

Ojo que estos experos inversores y hombres de negocios, lo están apostando todo a esto. Capitalismo poético.

2 33

#57 capitan__nemo *

www.google.com/search?q=porcentaje exito capital riesgo ia

1 30

#35 Aguarrás

Hasta cierto punto, relacionada:
www.meneame.net/story/gobierno-eeuu-da-ultimatum-anthropic-eliminar-re
Total, ¿Qué puede salir mal?.

1 25

#25 capitan__nemo

Algo sabria la ia que no somos capaces de discernir, o algo queria del ejecutivo. Hay que tomarlo como en "el secreto". El universo te habla. En este caso no el universo, es la ia la que te habla.
Los caminos de la ia son inescrutables

0 20

#60 chavi

Ni una cosa ni la otra.

Es el resultado al que le lleva su entrenamiento con un poco de azar para "humanizarlo"

0 11

#41 Nylo *

Aún recuerdo mi primera o segunda interacción con una IA. Estaba buscando comparar coches y pedí un listado de modelos de coche a la venta en España que cumpliesen una serie de criterios que le di. No hubo manera. Me sacaba una lista, sí, pero ya lo de cumplir los requisitos pedidos como que se le hacía bola. Algunos sí, otros no, y otros ni cerca.
Otras experiencias que tuve fue con generadores de imágenes. Le pides ciertas características y si tienes suerte las cumple, pero como se deje… » ver todo el comentario

0 10

#6 Sacapuntas

¡Vaya! Al final la inteligencia artificial también puede fallar como la inteligencia natural de su antigua secretaria.

0 10

#8 Robus

Pero si hubiese fallado la secretaria él podría enfadarse, pegarle la bronca y despedirla... ahora debe asumir que es culpa suya.

Creo que el puesto de secretaria está salvado, al menos de secretaria de jefes gordos.

2 31

#15 Ferran

Hasta que inventen las robopilinguis

2 29

#49 Setis

Ya verás que risas cuando le pongan a la robopilingui una mandíbula hidráulica de 250kg por cm2.

1 14

#48 almoss

Es una tecnología que lleva pocos años aquí y la gente eso no lo entiende. A día de hoy para cosas concretas bien, para cosas complicadas todavía es pronto (si es que llega a ese punto algún día). Yo normalmente cuando la uso reviso las respuestas con espíritu crítico, sin creérmelo solo porque sí.

0 9

#66 ernovation

No le puedes dar órdenes a una IA. Le das un prompt y la IA decide lo que va a continuación del prompt.

0 7

#32 jaramero

Es como cuando le dices a tu hijo que no haga una cosa. Se distrae, se le olvida y la acaba haciendo.

Y la misma situación cuando le dices que haga algo. O la hace en el momento o ya sabes lo que pasará.

Hay que aprender a crear prompts más efectivos

0 7

#43 endy *

Resumen: el director de AI aligmnent de Meta es gili*****. Y doblemente porque esto ha salido a la luz por lo que se lo contó a alguien

0 7

#51 Setis

Artificially intelligent. Eso es lo que es el director.

1 15

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

edición general

más visitadas

El lobby sionista ACOM amenaza de muerte a los españoles que se oponen al sionismo

Un diputado ha denunciado que le han dado de hostias

'Polònia' parodia un Torrente de izquierdas que elogia a los menas y es feminista: “El brazo progre de la ley”

La reacción de Óscar Puente a las palabras de Ayuso sobre su pareja: "Viene a reconocer que es muy corrupto"

Monográfico #10: Fun with maps

más votadas

Muere Chuck Norris a los 86 años

Europa planta a Trump y asume la postura de España en la guerra de Irán

El lobby sionista ACOM amenaza de muerte a los españoles que se oponen al sionismo

Un diputado ha denunciado que le han dado de hostias

Sumar propone en el Congreso prohibir las clases de religión en colegios públicos y concertados

suscripciones por RSS

La herramienta IA OpenClaw borra la bandeja de entrada del director de AI Alignment de Meta a pesar de las repetidas órdenes de detenerla [EN]