Desanonimización en línea a gran escala con modelos de lenguaje grande (LLM) [ENG]

188 meneos

1830 clics

Desanonimización en línea a gran escala con modelos de lenguaje grande (LLM) [ENG]

En resumen: Demostramos que los agentes de modelos de lenguaje grande (LLM) pueden averiguar quién eres a partir de tus publicaciones anónimas en Internet. En plataformas como Hacker News, Reddit y LinkedIn, así como en transcripciones de entrevistas anonimizadas, nuestro método identifica a los usuarios con gran precisión y es escalable a decenas de miles de candidatos. Aunque se sabe que es posible identificar de forma unívoca a una persona con sorprendentemente pocos atributos, esto solía tener limitaciones prácticas.

82 106 0 K 414

50 comentarios

82 106 0 K 414

Comentarios destacados:

#1 aletmp

Vale. Esto SI es un problema

14 135

#2 tul

tambien puede ser mentira o un stunt de marketing

6 83

#3 arturios

¿Marketing de que? pregunto, por que habla de diversos modelos de lenguaje, no está vendiendo uno.

0 11

#4 tul

de la alubia roja de montaña si te parece

1 16

#5 arturios

ya, lo que tu digas, corazón.

1 18

#6 Pablosky

Pero esto es de febrero, ¿no se había publicado antes?

Y si, es un problemon como dice

0 14

#9 Sacronte

Ya habia problemas previos. Este es OTRO problema

0 10

#31 masde120

Mientras lo instalan los gobiernos, por ahora van a ir pidiendo directamente el DNI para ver "si eres menor"

1 20

#46 tusko

Te hemos pillao Paco

0 9

#7 paco_camps_2011 *

¿Hace un par de años? Alguien aquí en Meneame demostró mediante ML que ciertos usuarios eran el mismo. Era un post muy interesante explicando como lo habia hecho, pero no lo encuentro.

15 129

#11 Eukherio

No es difícil detectar cuentas clon si te centras en patrones, estilo de escritura y horarios. Lo que pasa es que cuesta tiempo y esfuerzo, con lo que entiendo que sea algo automatizable para la IA.

3 25

#35 santim123

De las épocas de los chats de IRC cuando alguno te quería vacilar, con un poco de observación lo cazabas.

1 18

#36 Eukherio

Sí, fue ahí donde aprendí a pillar clones. Además en el IRC era mucho más fácil porque tenías faltas de ortografía, velocidad de escritura y demás. En Menéame, foros y redes sociales es algo más complicado porque tienes los correctores automáticos, y no sabes cuánto le lleva a cada uno escribir sus textos.

2 21

#12 Vicenteeee

A mí también me suena. Igual me estoy iendo mucho, pero creo que fue (si no es así, mis disculpas)

2 31

#30 AGlC

¿Y el multicuentas grito "¡Sensura

! "? Porqué es lo que les pega.

0 7

#50 chatOGT

Un tal Flufly. Lo enlaza

0 10

#16 Fumanchu

Específicamente lo reconocía por una expresión que solo había utilizado el en varios contextos.

2 16

#33 Supercinexin

Y sin ML. La usuaria hace años me saludó por mi primer nick de Menéame y luego cuando borré aquel usuario y creé éste también me volvió a saludar. Hace la tira de años de ésto, la IA no existía ChatGPT aún.

0 18

#44 traviesvs_maximvs *

¿Será este?
www.meneame.net/story/inteligencia-artificial-accion-h4x0r-cuenta-malv

6 68

#45 paco_camps_2011

¡¡ESE!! Dos años digo... y es de 2019

Me he vuelto loco buscando, sabía que aparecía el texto n-gramas pero en Google no aparece filtrando y ya veo que está como story y el robots.txt de Meneame no permite indexarlo. Y con el buscador interno de Meneame nos olvidamos.

¡Muchas gracias!

5 58

#49 chatOGT

colosal!

0 10

#13 Ninethousand *

Recordatorio de cuán importante es evitar compartir datos personales en internet (o incluso aquellos que te identifican dentro de un grupo relativamente pequeño de personas, como el "participé en este proyecto concreto" del artículo). Incluso compartir que has vivido en una ciudad o un país o que has estudiado cierta carrera (algo de lo que yo mismo he pecado) puede ser clave para identificarte si consiguen otros datos.

Con o sin IA, siempre hemos sabido que íbamos a llegar al punto… » ver todo el comentario

7 79

#21 shake-it

Lo mismo también es importante mentir sobre tu personaje en internet y ser profesor de chino mandarín, estar embarazado de gemelos, ser profesor, abogado...

6 64

#24 The_Ignorator

del opus dei, vigilante jurado...

0 10

#28 nopolar

...modelo, cantante y actriz...

2 22

#37 Aenedeerre

eres popero y has estado en el Sonorama los años 19, 21 y 23 te cacé!!!

0 6

#42 nopolar

tengo interné

0 9

#41 The_Ignorator

Lo nuestro venía de aqui.....me da cosa el hombre porque claramente no está bien, pero a algunos se nos ha quedao.
www.youtube.com/watch?v=vt0E9I5JZM0

1 13

#32 LeDYoM

Ding, ding ding ding.
Estoy de acuerdo con tu postulado, pero "profesor" dos veces nos has colado.

3 42

#39 shake-it

Sé que tienes 50 años con +/- 5 años de error. Y sin LLM ni nada.

2 36

#40 LeDYoM

No lo dudo. Yo se que tú veías el 1-2-3

4 52

#20 angelitoMagno *

Pues a ver, en realidad, si tienes mucha presencia en Internet, cualquiera puede averiguar quien eres.

Yo recuerdo a un usuario de por aquí que una vez se dedicó a buscar cosas sobre mi y sobre otros dos usuarios, intentando demostrar que "nos pagaba el PSOE" o no se que mierdas, y tirando de aquí, de Twitter, de otros sitios, pues acabó averiguando cosas. Acabó averiguando que yo y los otros usuarios que investigó eramos unos tipos aburridos sin conexiones de ningún tipo pero bueno,… » ver todo el comentario

3 45

#14 ostiayajoder

Bueno.

Pues ya no hace falta oedir el DNI en las redes sociales

Todos contentos.

Y no tengo ninguna duda de q esto YA se hace en RRSS pq PUEDEN HACERLO y no es una idea tan loca ni extrafalaria; la IA esta para esto.....

De hecho la solucion para esto tambien es bastante obvia...

2 36

#47 vaiano

ilústrame ! Borrar cuenta Facebook y de las redes que encuentres?

0 9

#48 ostiayajoder

No:

Pasar lo q escribas por una IA antes de postearlo diciendole q lo arregle como si fuera un discurso del perroxanxe, de abascal o del feijol en meneame, einstein en reddit, jimmy kimmel em twitter....

Usar la IA para liar a la IA.

Hay q hacer un plugin para navegador para automatizar esto... igual uso una IA oara hacerlo

0 10

#18 cosmonauta *

El día que se lo pasen al chochenko vamos a flipar en colores.

0 19

#8 Celuis *

Ciado se quiera publicar algo sensible, hacerlo anonimizado y con otra perronalidad

1 18

#15 chochis

puedes pasar tu publicación por un modelo y decirle que use otro estilo de escritura

2 21

#34 torrrquemada

También puedes traducirlo a otro idioma para luego destraducirlo.

0 8

#38 chochis

adivina que hace un LLM?

1 16

#22 ContinuumST *

Claro, si se dicen cosas como... "cuando trabajaba en [.....] blablab..:" O cosas como... "viviendo en la ciudad de [....]... Y si tienes un hobby peculiar como (quéseyo) pintar maquetas de submarinos fallidos... Pues... Se le facilita mucho la cosa a la búsqueda intensiva. Dudo mucho que a muchos de aquí se le pudiera aplicar y saber a ciencia cierta qué persona real hay detrás.

0 13

#10 taranganas

O sea que no sabian quienes eramos ya?cual es el problema. Estan traficando con datos nuestros desde que el hombre esta en la tierra: Stasy, kgb, cia, nsa, mossad, cni , iglesia en sus confesionarios y muchas mas. Una mas pero rapida y refinada

1 12

#29 DenisseJoel

Tienes razón, y voy a llevar un paso adelante tu razonamiento: también es lo mismo lanzar piedras que bombas atómicas.

2 27

#19 --760006--

¿Eso vale ante un juez?

0 11

#25 Paisos_Catalans

Cazatrolls. Esto ya lo predijeron los de South Park

0 10

#17 Gotnov *

Si algo bueno se puede sacar de esto, es que definitivamente nos aleja de ser NPC.

0 9

#23 neiviMuubs *

Hace tiempo, recuerdo que a un administrador de un foro criminal en la deepweb, le localizaron "a ojo" por la forma que tenía de cerrar (o empezar, no recuerdo ahora) sus mensajes. Resultó que lo hacía también en sus mensajes de facebook. Casos como ese les servirá a las agencias gubernamentales de excusa ante la opinión pública para hacer cribados masivos de datos, pero ni cotiza que van a abusar y que la cosa da miedo.

0 8

#26 celyo *

esta el caso famoso de Unabomber, que fue localizado a través de sus escritos.

Tuvieron que publicar su manifiesto y su hermano logró reconocer su forma de escritura.

Hay otro caso en España, de un secuestro, no recuerdo de quien, que fueron acotando donde vivían los sujetos por su forma de hablar.

Que logre la IA tsl logro de forma masiva, es sorprendente

2 37

#27 beldin

www.larazon.es/tecnologia/meta-crea-clon-mark-zuckerberg-interactuar-e el otro dia estaba esto x meneame, despues de leer este articulo me entro una duda ¿pueden las ia sacar tu "personalidad" de las coversaciones? ¿las big tech pueden usarla para algo?

0 6

#43 Cazatrolls

Si no pueden, podrán. Y por supuesto que eso se puede monetizar, así que las empresas lo usarán, no me cabe duda.

0 10

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

Tecnología, Internet y juegos

más visitadas

No es el futuro, es el presente: ya puedes ver en directo cómo un robot humanoide hace el turno de trabajo de una persona

Cruce de cables: Cómo era viajar cuando no existía la navegación mediante GPS y había que tirar de mapas en papel

Dubái ha llegado a la misma conclusión que Rusia. Para proteger su petróleo de los drones hay algo mejor que misiles: jaulas gigantes

Una tecnología israelí permite identificar a los usuarios del servicio de Internet por satélite Starlink de Musk [EN]

El proyecto espacial más ambicioso de China: un satélite hiperespectral avanzado para hacer un "TAC" a la Tierra

más votadas

Una tecnología israelí permite identificar a los usuarios del servicio de Internet por satélite Starlink de Musk [EN]

No es el futuro, es el presente: ya puedes ver en directo cómo un robot humanoide hace el turno de trabajo de una persona

Cruce de cables: Cómo era viajar cuando no existía la navegación mediante GPS y había que tirar de mapas en papel

Dubái ha llegado a la misma conclusión que Rusia. Para proteger su petróleo de los drones hay algo mejor que misiles: jaulas gigantes

El proyecto espacial más ambicioso de China: un satélite hiperespectral avanzado para hacer un "TAC" a la Tierra

suscripciones por RSS

Desanonimización en línea a gran escala con modelos de lenguaje grande (LLM) [ENG]