El ejecutivo tuvo que apagar manualmente la IA para impedir que el bot siguiera borrando datos (...) Como muchos otros entusiastas, Yue tenía una configuración con un Mac Mini y OpenClaw ejecutándose en él para diversas tareas. Mientras Claw archivaba correos electrónicos antiguos de algunas cuentas, ella también le pidió que «revisara también esta bandeja de entrada y le sugiriera qué archivar o eliminar, sin tomar ninguna medida hasta que yo se lo indicara» (sic; énfasis nuestro). Claw comenzó a borrar toda la bandeja de entrada.
|
etiquetas: openclaw , meta , correo electrónico
Pero es que además da igual que las órdenes estén en la ventana de contexto porque, igualmente, el modelo puede saltárselo a la torera ya que cada vez que el modelo predice autoregresivamente hay una posibilidad nada desdeñable de que el modelo infiera algo completamente contrario a la intención de las normas dadas y el contexto previo. Lo cual sólo se puede solucionar con pragmatismo y entendimiento que los modelos de lenguaje no tienen (porque no hay nadie al volante, ni siquiera un alguien artificial).
Es lo que yo llamo el problema del genio de la lámpara: si le pides algo a un modelo de lenguaje, el modelo encontrará más maneras de "cumplir tu deseo mal o de manera mediocre" que maneras de "cumplir tu deseo bien o de
…...
"Eh, OpenClaw, quiero empezar a usar la técnica inbox cero con mi correo"
"Perfecto, aquí tienes, tu bandeja de entrada vacía. ¿Quieres que además te cree una firma?"
Como si costase tanto esfuerzo leerse el correo por la mañana y contestar alguno.
Vamos, que además de alucinar es como si tuvieran demencia senil. Cada día más útiles.
Pero no, son simple estadística a lo bestia, más tontas que un autobús lleno de directivos.
¿Se te ha ocurrido publicarlo como un estudio serio?
Se puede mejorar a base de instrucciones positivas:
En lugar de "No aceptes X" es mejor "Excluye terminantemente cualquier caso X. El ambito de actuación estará restringido unicamente a Y".
Aunque tampoco es infalible...
Pero eso es solo un detalle que se puede solucionar, o como poco tratar de mejorar, con prueba y… » ver todo el comentario
Pero es que además da igual que las órdenes estén en la ventana de contexto porque, igualmente, el modelo puede saltárselo a la torera ya que cada vez que el modelo predice autoregresivamente hay una posibilidad nada desdeñable de que el modelo infiera algo completamente contrario a la… » ver todo el comentario
x.com/MZBS/status/1808796517852913888 #renfecito #renfe #becarios #pwned
cadenaser.com/nacional/2024/07/05/renfe-responde-a-la-polemica-sobre-s
Espero que no le pongan al becario al mando de una base de datos SQL.
Mejor que pongan una IA. Total, ni que no hubiera mil millones de ejemplos en internet de cómo usar mal PHP y MySQL metiendo vulnerabilidades de SQL injection por error. Y, si hubiera ese mil millones de ejemplos, seguro que no los usarían para entrenar las IAs.
/sarcasmo gigantesco en caso de que no sea absolutamente obvio
Eso sí, como comentario sensacionalista/emocional para palmaditas de los del bar está cojonudo. Una buena ilustración de por qué en cualquier situación empresarial cualquiera elegiría a un LLM antes que alguien que escribe comentarios así.
Concuerdo contigo en esto:
"Si este ese tipo es un "especialista en IA" que Dios nos pille confesados, porque estamos en manos de absolutos idiotas."
Abrazo.
Y esto ocurre ahora que los departamentos de IA tienen prácticamente presupuesto infinito, tienen que recortar por todos lados porque sino el gasto se les va de las manos. Imaginad en cuanto empiecen a recortar e intentar sacar beneficios de verdad, estará todo ultra… » ver todo el comentario
www.google.com/search?q=porcentaje exito capital riesgo ia
www.meneame.net/story/gobierno-eeuu-da-ultimatum-anthropic-eliminar-re
Total, ¿Qué puede salir mal?.
Los caminos de la ia son inescrutables
Otras experiencias que tuve fue con generadores de imágenes. Le pides ciertas características y si tienes suerte las cumple, pero como se deje… » ver todo el comentario
Creo que el puesto de secretaria está salvado, al menos de secretaria de jefes gordos.
Y la misma situación cuando le dices que haga algo. O la hace en el momento o ya sabes lo que pasará.
Hay que aprender a crear prompts más efectivos