Tecnología, Internet y juegos
91 meneos
974 clics
Desanonimización en línea a gran escala con modelos de lenguaje grande (LLM) [ENG]

Desanonimización en línea a gran escala con modelos de lenguaje grande (LLM) [ENG]

En resumen: Demostramos que los agentes de modelos de lenguaje grande (LLM) pueden averiguar quién eres a partir de tus publicaciones anónimas en Internet. En plataformas como Hacker News, Reddit y LinkedIn, así como en transcripciones de entrevistas anonimizadas, nuestro método identifica a los usuarios con gran precisión y es escalable a decenas de miles de candidatos. Aunque se sabe que es posible identificar de forma unívoca a una persona con sorprendentemente pocos atributos, esto solía tener limitaciones prácticas.

| etiquetas: desanonimización , llm , escala
46 45 0 K 414
46 45 0 K 414
Vale. Esto SI es un problema
#1 tambien puede ser mentira o un stunt de marketing
#2 ¿Marketing de que? pregunto, por que habla de diversos modelos de lenguaje, no está vendiendo uno.
#3 de la alubia roja de montaña si te parece
#4 ya, lo que tu digas, corazón.
Pero esto es de febrero, ¿no se había publicado antes?

Y si, es un problemon como dice #1
#1 Ya habia problemas previos. Este es OTRO problema :wall:
¿Hace un par de años? Alguien aquí en Meneame demostró mediante ML que ciertos usuarios eran el mismo. Era un post muy interesante explicando como lo habia hecho, pero no lo encuentro.
#7 No es difícil detectar cuentas clon si te centras en patrones, estilo de escritura y horarios. Lo que pasa es que cuesta tiempo y esfuerzo, con lo que entiendo que sea algo automatizable para la IA.
#7 A mí también me suena. Igual me estoy iendo mucho, pero creo que fue @carademalo (si no es así, mis disculpas)
#7 Específicamente lo reconocía por una expresión que solo había utilizado el en varios contextos.
Recordatorio de cuán importante es evitar compartir datos personales en internet (o incluso aquellos que te identifican dentro de un grupo relativamente pequeño de personas, como el "participé en este proyecto concreto" del artículo). Incluso compartir que has vivido en una ciudad o un país o que has estudiado cierta carrera (algo de lo que yo mismo he pecado) puede ser clave para identificarte si consiguen otros datos.

Con o sin IA, siempre hemos sabido que íbamos a llegar al punto…   » ver todo el comentario
#13 Lo mismo también es importante mentir sobre tu personaje en internet y ser profesor de chino mandarín, estar embarazado de gemelos, ser profesor, abogado...
#21 del opus dei, vigilante jurado...
#24 ...modelo, cantante y actriz...
Bueno.

Pues ya no hace falta oedir el DNI en las redes sociales

Todos contentos. :-D

xD

Y no tengo ninguna duda de q esto YA se hace en RRSS pq PUEDEN HACERLO y no es una idea tan loca ni extrafalaria; la IA esta para esto.....

De hecho la solucion para esto tambien es bastante obvia...
Pues a ver, en realidad, si tienes mucha presencia en Internet, cualquiera puede averiguar quien eres.

Yo recuerdo a un usuario de por aquí que una vez se dedicó a buscar cosas sobre mi y sobre otros dos usuarios, intentando demostrar que "nos pagaba el PSOE" o no se que mierdas, y tirando de aquí, de Twitter, de otros sitios, pues acabó averiguando cosas. Acabó averiguando que yo y los otros usuarios que investigó eramos unos tipos aburridos sin conexiones de ningún tipo pero bueno,…   » ver todo el comentario
El día que se lo pasen al chochenko vamos a flipar en colores.
Ciado se quiera publicar algo sensible, hacerlo anonimizado y con otra perronalidad {0x1f601}
#8 puedes pasar tu publicación por un modelo y decirle que use otro estilo de escritura :-D
Claro, si se dicen cosas como... "cuando trabajaba en [.....] blablab..:" O cosas como... "viviendo en la ciudad de [....]... Y si tienes un hobby peculiar como (quéseyo) pintar maquetas de submarinos fallidos... Pues... Se le facilita mucho la cosa a la búsqueda intensiva. Dudo mucho que a muchos de aquí se le pudiera aplicar y saber a ciencia cierta qué persona real hay detrás.
¿Eso vale ante un juez? :tinfoil: :troll:
Cazatrolls. Esto ya lo predijeron los de South Park
Si algo bueno se puede sacar de esto, es que definitivamente nos aleja de ser NPC.
O sea que no sabian quienes eramos ya?cual es el problema. Estan traficando con datos nuestros desde que el hombre esta en la tierra: Stasy, kgb, cia, nsa, mossad, cni , iglesia en sus confesionarios y muchas mas. Una mas pero rapida y refinada
#10 Tienes razón, y voy a llevar un paso adelante tu razonamiento: también es lo mismo lanzar piedras que bombas atómicas.
Hace tiempo, recuerdo que a un administrador de un foro criminal en la deepweb, le localizaron "a ojo" por la forma que tenía de cerrar (o empezar, no recuerdo ahora) sus mensajes. Resultó que lo hacía también en sus mensajes de facebook. Casos como ese les servirá a las agencias gubernamentales de excusa ante la opinión pública para hacer cribados masivos de datos, pero ni cotiza que van a abusar y que la cosa da miedo.
#23 esta el caso famoso de Unabomber, que fue localizado a través de sus escritos.

Tuvieron que publicar su manifiesto y su hermano logró reconocer su forma de escritura.

Hay otro caso en España, de un secuestro, no recuerdo de quien, que fueron acotando donde vivían los sujetos por su forma de hablar.

Que logre la IA tsl logro de forma masiva, es sorprendente
www.larazon.es/tecnologia/meta-crea-clon-mark-zuckerberg-interactuar-e el otro dia estaba esto x meneame, despues de leer este articulo me entro una duda ¿pueden las ia sacar tu "personalidad" de las coversaciones? ¿las big tech pueden usarla para algo?

menéame