Tecnología, Internet y juegos
16 meneos
98 clics

[EN] Perplexity está ofuscando su identidad para robar la información de los sitios web

Cloudfare detalla una investigación sobre como Perplexity está usando técnicas de scraping para ofuscar su identidad y evitar los bloqueos por parte de las webs, ignorando así el deseo de sus dueños como se define en el fichero robots.txt. Entre las tecnicas que usan: rotación de ips, usar browser fingerprint falsos, ignorar el robots.txt.

| etiquetas: perplexity , ai , bots , amenaza , cloudfare
13 3 0 K 234
13 3 0 K 234
El articulo es muy bueno, han usado un honeypot (unas web falsas) para inducir a Perplexity a robar el contenido de estas. Lo más interesante es que cuando CloudFare se lo pone complicado usando reglas avanzadas para detección de bots entonces la IA directamente alucina y da contenido incorrecto.  media
La IA se está cargando Internet.
#4 Bueno, eso ya lo empezaron haciendo las grandes empresas que se dedican a la publicidad. Aunque prefieren ser llamadas "grandes tecnológicas".  media
#4 internet es un foro
Joder, ignorar el txt no es ofuscación. :shit:
#2 hay que leer, no ofuscarse
#3 no se ofusque con este terror tecnologico que ha construido xD
#3 La ofuscación se refiere a encubrir el significado de una comunicación haciéndola más confusa y complicada de interpretar.

#5

Que saltarse un txt no os ofusque.
#2 El robots.txt siempre me pareció una medida de seguridad? privacidad? de mierda. "Oye, porfavorcito scraper, no entres en la carpeta 'matematicas' de mi servidor"

menéame