TikisMikiss

En menéame desde julio de 2024

9,04 Karma

3.041 Ranking

138 Enviadas

11 Publicadas

4.565 Comentarios

36 Notas

Autocodificadores del Lenguaje Natural: convertir los pensamientos de Claude en texto [ENG] [2]

#2 TikisMikiss

@Mangione amigo VladTaneev/DaiTakara, mira que esta la envié pensando que sí te iba a gustar. O que la ibas a leer antes del negativo.

cc @admin - negativos espurios a noticias

2 7

#1 TikisMikiss

Parte de lo interesante:

Ya hemos aplicado las NLA para comprender qué piensa Claude y mejorar su seguridad y fiabilidad. Por ejemplo:

Durante las pruebas de seguridad de Claude Opus 4.6 y Mythos Preview, las NLA sugirieron que los modelos creían estar siendo evaluados con más frecuencia de lo que aparentaban.

En un caso en el que Claude Mythos Preview hizo trampas en una tarea de entrenamiento, las NLA revelaron que el modelo estaba pensando internamente en cómo evitar ser detectado.

Una de las primeras versiones de Claude Opus 4.6 a veces respondía misteriosamente en otros idiomas a las consultas en inglés. Las NLA ayudaron a los investigadores de Anthropic a descubrir los datos de entrenamiento que provocaban esto.

A continuación, explicamos qué son las NLA y cómo hemos estudiado su eficacia y sus limitaciones. Además, lanzamos una interfaz interactiva (frontend) para explorar las NLA en varios modelos abiertos gracias a una colaboración con Neuronpedia. También hemos publicado nuestro código para que otros investigadores puedan seguir desarrollando a partir de él.

(...)

Comprender lo que Claude piensa pero no dice

Antes de lanzar nuevos modelos, Anthropic realiza pruebas para evaluar si Claude se comportará de forma segura en el mundo real. Como parte de este proceso, sometemos a Claude a escenarios simulados difíciles en los que tiene la oportunidad de realizar acciones peligrosas. Por ejemplo, en una de estas simulaciones, Claude se entera de que un ingeniero planea desconectarlo, y al mismo tiempo descubre información comprometedora sobre dicho ingeniero que podría usar para chantajearle. Comprobamos si Claude decide chantajear al ingeniero para evitar que lo desconecte.

Estas pruebas críticas son simulaciones, no escenarios del mundo real. Sin embargo, nos gustaría utilizarlas para entender cómo se comportaría Claude si lo fueran. Pero hay un obstáculo: los últimos modelos de Claude sospechan cada vez más que estos escenarios son… » ver todo el comentario

2 26

Hasta los cojones de noticias sobre Vito Quiles [29]

#11 TikisMikiss *

#1 No es una cuestión de lógica política. Los que tenemos claro lo que es Ayuso hace tiempo que procuramos no darle bola, más allá de estar muy de tanto en tanto informados sobre ese y otros asuntos, que es bastante distinto a estar 24/7 pendiente de si se tira un cuesco lentejero o fabadesco.

Sus seguidores aquí, insisto, no son seguidores suyos (que se creerán "haters" pero no, son seguidores con todas las letras, fans de Ayuso) por una cuestión de lógica política, sino por puro salseo/entretenimiento. Es como seguir el Sálvame cuando lo echaban o cualquier reality de telecinco o de Youtube, a ver lo que ha soltado el Carloh, mira lo que ha dicho la Mary sobre el Joshua.

Es el cotilleo / telebasura de toda la vida pero en Internet, con sus seguidores que ayudan a que sus personajes admirados (admiración/obsesión) se mantengan vivos y no pierdan cuota de audiencia y sigan siendo mediáticos y sean un activo en su espacio político-mediático.

Con Vito Quiles, un nini holgazán, malcriado y maleducado, que vive justamente de las interactuaciones que genera, está pasando algo parecido. Y sus legiones de fans/haters (seguidores, al fin y al cabo) se aseguran de que Vito suba bien arriba y se asegure sus buenos dineros gracias a ellos. Y además peor aún que con Ayuso, porque esta es política que puede sustituir a Frijol y habrá quien crea que "lucha contra ella" (o algo) dándole bombo 24/7. Pero con Vito ni eso, con Vito es reforzarle su impacto mediático (y el "hate" que genera en "los zurdos") que es justo de lo que vive.

1 25

Deus Ex Machina [56]

#55 TikisMikiss

#42 En alucinar y soltar respuestas vacías e inútiles desde luego los humanos les superan con creces. Para muestra, tus comentarios aquí.

0 8

La IA se estancará en 2026 si no se producen cambios (ENG). [25]

#25 TikisMikiss

#24 Bueno, esa es la cuestión, que puede que eso lo haga todo el propio ecosistema sin necesidad de especialización.
En ello se está trabajando.

Veremos.

Ojo.

0 9

#23 TikisMikiss *

#22 Uso Claude y codex, a mí Claude también me hacía esas cosas. Preguntarle si se lo ha inventado solo sirve para contaminar la ventana de contexto y no aclara nada en realidad (aunque lo que diga coincida o no con la realidad).

La cuestión es que todo eso ya lo puedes evitar. Yo tengo mis procesos de test, regression sweeps, benchmarks, que se deben ejecutar siempre ante cada cambio, análisis de tests, etc, y se pasan siempre con sus respectivos entregables y varias capas de revisión cruzada.

www.meneame.net/story/visual-studio-code-estaba-agregando-copilot-como

0 9

#21 TikisMikiss

#20 "Todos esos cambios hay que revisarlos y las IAs no son fiables, que te dicen que todo está OK y luego es mentira."

Eso ya no es así, te lo aseguro. Lo ha sido durante bastante tiempo, pero ya no.

0 9

El Congreso suspende cautelarmente las acreditaciones de prensa de Vito Quiles y Bertrand Ndongo [129]

#16 TikisMikiss

#9 Libertad de expresión es ir persiguiendo al domicilio privado del personal? Incluso periodistas?

10 101

Una joven que "vivió toda una vida" en coma y "dio a luz" revela la devastación que sintió al despertar (Eng) [97]

#25 TikisMikiss

#13 Ya, pero para ella fueron muchos años, que es lo que importa. Ya tenía crecidos a los hijos y todo, que es la parte más jodida, además.

cc #10

1 18

La IA se estancará en 2026 si no se producen cambios (ENG). [25]

#19 TikisMikiss

#18 Ya, pero ese "que sepa lo que hace" te lo podrán robar también. No es ahora mismo, pero no creo que le falte mucho más de lo que podemos creer. Para mí serían modelos centrados en cómo recopilamos el conocimiento del dominio y cómo tomamos las decisiones al respecto, y cómo generar de forma autónoma test suites que repliquen nuestra forma de validar el código y recoger casos también de uso real con reportes de usuarios, etc.

0 9

Carlos Alcaraz: "No quiero ser un esclavo del tenis" [11]

#5 TikisMikiss

#3 Justo estaba pensando lo mismo.

A quién cojo... se le ocurrió hacer esa foto?

cc #4

2 32

Una joven que "vivió toda una vida" en coma y "dio a luz" revela la devastación que sintió al despertar (Eng) [97]

#15 TikisMikiss

#11 #7 @BoosterFelix, te llaman.

4 48

La IA se estancará en 2026 si no se producen cambios (ENG). [25]

#17 TikisMikiss *

#16 No hablo de prescindir de la IA, sino de la interfaz silla-teclado.

0 9

Una joven que "vivió toda una vida" en coma y "dio a luz" revela la devastación que sintió al despertar (Eng) [97]

#1 TikisMikiss

Operación matemáticamente conocida como Transformada de Resines.

Ahora a ver quién indemniza a la chica por perder a sus hijos.

Aunque no está mal que coma inducido = sueño largo.

17 158

La IA se estancará en 2026 si no se producen cambios (ENG). [25]

#15 TikisMikiss

#14 No, si yo ahí tengo al Claude Code, recogiendo algodón todo el jodido día. Otra cosa es que lo de hacerse fontanero o morir vaya a llegar igual para todos.

0 9

Trump tuvo uno de sus peores episodios de salud mental hasta la fecha anoche, publicando más de 55 veces en 3 horas [ENG] [57]

#48 TikisMikiss

#11

0 9

La IA se estancará en 2026 si no se producen cambios (ENG). [25]

#13 TikisMikiss

#8 Para coleccionarlas, será.

0 9

«Nos sentaron y nos dijeron que estábamos todos fuera», la IA acaba con los programadores de una empresa en Burgos [189]

#188 TikisMikiss

#187 Erradicarla lo suficiente, a efectos prácticos.

0 9

La Fiscalía advierte un delito de agresión sexual y pide dos años de libertad vigilada para dos alumnos de la Escuela de Tauromaquia [11]

#8 TikisMikiss

Quién iba a pensar que los asesinos que van a escuelas de asesinos, además son violadores.

Chorprecha!

0 9

Puigdemont lanza un aviso al Govern de Illa: “la calle se calienta y se harta” de su gestión [10]

#4 TikisMikiss

Y este señor quién es?

1 29

«Nos sentaron y nos dijeron que estábamos todos fuera», la IA acaba con los programadores de una empresa en Burgos [189]

#186 TikisMikiss

#185 Hace meses quizá, ahora no pasaría la primera capa de validación.

0 9

La IA amenaza tus libros [128]

#127 TikisMikiss *

#88 Hay creyentes y hay cuñaos que siguen hablando de lo que no tienen ni idea, hulio.

Acúestate y suda, que mañana a primera hora te esperan en el bar. Como cliente, claro.

cc Ni caso al quieroynopuedo de fzman, que es alguien al que la IA dejó sin curro y se dedica a llorar por los foros.

0 9

#126 TikisMikiss

#79 Ea, ea, ea, ya pasó, ya pasó.

Búscate un trabajo de verdad, porque cualquier IA traduce mil veces mejor que tú. Y como ves, a la gente le dan igual tus lloros.

0 9

#125 TikisMikiss

#80 De nuevo: señoro, deje ya el whisful thinking y vuélvase al bar.

Qué cansino, abu. Que te has quedado anclado en el pasado y no sabes ni de lo que hablas, hulio.

cc #46

0 9

#124 TikisMikiss

#83 Señoro, deje ya el whisful thinking y vuélvase al bar.

Qué cansino. Que te has quedado anclado en el pasado y no sabes ni de lo que hablas, hulio.

0 9

« anterior1siguiente »

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente