[EN] Perplexity está ofuscando su identidad para robar la información de los sitios web

34 meneos

143 clics

[EN] Perplexity está ofuscando su identidad para robar la información de los sitios web

Cloudfare detalla una investigación sobre como Perplexity está usando técnicas de scraping para ofuscar su identidad y evitar los bloqueos por parte de las webs, ignorando así el deseo de sus dueños como se define en el fichero robots.txt. Entre las tecnicas que usan: rotación de ips, usar browser fingerprint falsos, ignorar el robots.txt.

| etiquetas: perplexity , ai , bots , amenaza , cloudfare

26 8 0 K 320 tecnología

13 comentarios

26 8 0 K 320 tecnología

Comentarios destacados:

#1 Torrezzno *

El articulo es muy bueno, han usado un honeypot (unas web falsas) para inducir a Perplexity a robar el contenido de estas. Lo más interesante es que cuando CloudFare se lo pone complicado usando reglas avanzadas para detección de bots entonces la IA directamente alucina y da contenido incorrecto.

6 62

#13 infestissumam

Muy mal lo de Perplexity... salvo que seas usuario de Perplexity.

0 15

#4 ContracomunistaCaudillo

La IA se está cargando Internet.

4 36

#8 R2dC

Bueno, eso ya lo empezaron haciendo las grandes empresas que se dedican a la publicidad. Aunque prefieren ser llamadas "grandes tecnológicas".

0 8

#9 moxid

internet es un foro

0 16

#12 RamonMercader

ya estaba bastante roto por el SEO, bots etc, esto es la estocada final.

No se de que manera se podría hacer pero necesitamos un internet de solo humanos. Pero no se me ocurre ninguna forma ni realista ni "ciencia ficción" (pero teoricamente realizable) de hacerlo ni he visto ninguna propuesta viable. Y menos a esta altura donde un bot asistido por IA puede suplantar a un humano de una forma cada día mas creible.

En mi humilde opinión en la próxima década vamos a ver el regreso de los criticos especializados, humanos que seleccionen contenido de calidad en todos los ambitos

0 6

#2 Rorschach_

Joder, ignorar el txt no es ofuscación.

0 9

#3 Torrezzno

hay que leer, no ofuscarse

1 18

#5 tul

no se ofusque con este terror tecnologico que ha construido

2 23

#6 Rorschach_

La ofuscación se refiere a encubrir el significado de una comunicación haciéndola más confusa y complicada de interpretar.

Que saltarse un txt no os ofusque.

0 9

#7 R2dC

El robots.txt siempre me pareció una medida de seguridad? privacidad? de mierda. "Oye, porfavorcito scraper, no entres en la carpeta 'matematicas' de mi servidor"

0 8

#10 Setis

Una declaración de permisos entre caballeros. Pero de esos quedan pocos.

Lo que sí debería servir es para demandas. "Yo no sabía que no estaba permitido leer el contenido" - "Lo pone en el robots.txt que es el estándar para estas cosas"

0 7

#11 musg0

También desde IPs de Alibaba hacen parecido. Tuve que bloquear todo un rango porque entraban a saco rotando cientos de IPs y "scrapeando" a toda velocidad sin hace caso al robots.txt
Ojalá les revienten los servidores

0 6

menéame

condiciones legales / de uso / y de cookies
/ quiénes somos
/ licencias: código, gráficos, contenido
/ HTML5
/ codigo fuente

edición general

más visitadas

El vídeo de los bañistas de Granada que retienen a los inmigrantes desembarcados

China demuestra una vez más que no hay obstáculos insuperables: la carretera inverosímil entre montañas (ENG)

Desmontando el Día de la Liberación Fiscal

El peso argentino se hunde y un Milei desesperado culpa a todo el mundo menos a él mismo

La historia de Ignacio, el hombre de 82 años que busca su palo en Roquetas y tiene a las redes en vilo

más votadas

El Gobierno aparca la compra de cazas F-35 estadounidenses y busca alternativas europeas

La culpa del apagón la tuvieron las centrales de gas natural

Crisis de la vivienda: Fondos de Israel y EE UU se lanzan a comprar lotes de pisos con fuertes rebajas en Valencia

Varios medios omiten que los dos hombres que mataron a otro a golpes en Tenerife son miembros de una empresa de Desokupación

La Guardia Civil, más cuestionada que nunca: Balas y Montoro, el audio escondido de Aldama o las “teorías superadas” con la DANA

suscripciones por RSS

[EN] Perplexity está ofuscando su identidad para robar la información de los sitios web