Eli
236meneos

Digg estrena un sistema 'infalible' para evitar el envío de historias duplicadas

En sitios como Digg o Menéame es habitual encontrarse con que una misma noticia ha sido enviada repetidamente por varios usuarios en un breve espacio de tiempo. Es algo normal teniendo en cuenta que cada día se menean cientos de historias. Pero Digg ha estrenado un sistema ultra-avanzado que, según los ingenieros del portal, va a acabar con los artículos duplicados. Bueno, o no... En inglés: blog.digg.com/?p=866

negativos: 1  usuarios: 158  anónimos: 78  compartir:  twitter  facebook  friendfeed
  1. #1   El sistema está todavía en periodo de pruebas y por el momento únicamente bloquea por defecto las URLs idénticas. <== Lo de las URLs idénticas lo tiene menéame, desde hace eones.
    votos: 44, karma: 517
    por miguelitor el 01-07-2009 15:16 UTC
  2. #2   Entonces perderia la gracia de pelearnos por ¿relacionada o dupe?...
    votos: 4, karma: 55
    por jamaicano el 01-07-2009 15:17 UTC
  3. #3   Aquí hay hordas de aguerridos buscadupes, eso basta para dejar en la sombra a la inteligencia artificial de Digg.
    votos: 63, karma: 684
    por --14179-- el 01-07-2009 15:18 UTC
  4. #4   #1 DIGG FAIL! MENÉAME WIN! :-D
    votos: 19, karma: 231
    por jm22381 el 01-07-2009 15:18 UTC
  5. #5   #3
    [chiste_malo]
    ¿Las hordas tienen inteligencia?
    [/chiste_malo]
    votos: 1, karma: 20
    por MarioQuartz el 01-07-2009 15:19 UTC
  6. #6   esta noticia es duplicada!!!!!!!!!!!!
    votos: 2, karma: 37
    por grima el 01-07-2009 15:20 UTC
  7. #7   ¿Nadie lo va a decir?
    Pues lo digo yo:
    diggowned www.abadiadigital.com/imagenes/digg-duplicadas.png

    :P
    votos: 23, karma: 267
    por miguelitor el 01-07-2009 15:25 UTC
  8. #8   #1

    Ingenieros de Digg:

    Amo' a ver... creo que si uno esto aquí, junto por allá, adapto la junta de la culata...

    ¡Mirad! ¡He conseguido un sistema infalible para las dupes!

    consulta = "Select * from PAGINAS where URL=" + url;
    if(query(consulta)!=0){
    dupe = true;
    }
    votos: 24, karma: 266
    por Moussenger el 01-07-2009 15:26 UTC
  9. votos: 35, karma: -198
    por Danny el 01-07-2009 15:26 UTC
  10. #10   La verdad es que en Digg hay demasiados envios duplicados y lo que es peor, en portada.
    votos: 1, karma: 33
    por Kery el 01-07-2009 15:26 UTC
  11. #11   #9 No se a que viene ese ataque personal.
    votos: 4, karma: 41
    por miguelitor el 01-07-2009 15:28 UTC
  12. por --127476-- el 01-07-2009 15:28 UTC
  13. #13   #11 es una broma, que poco sentido del humor!
    Carme pilla todas las duplicadas al vuelo, por eso lo digo. En fin.
    votos: 7, karma: 70
    por Danny el 01-07-2009 15:32 UTC
  14. por --116310-- el 01-07-2009 15:33 UTC
  15. #15   #14 Verás, como con la tontería voten dupe... XD
    votos: 5, karma: 77
    por miguelitor el 01-07-2009 15:37 UTC
  16. #16   Aquí tenemos un script muy efectivo llamado HAJO, y lleva funcionando desde hace lustros. Aunque el HAJO se repite mucho y deja siempre los mismos comentarios con regusto es muy eficaz

    Gracias HAJO (HAbladorcito JOrsovernet)
    votos: 10, karma: 149
    por kurioso el 01-07-2009 15:37 UTC
  17. #17   #14 Descartaayaakesdupeeeee!
    votos: 2, karma: 38
    por ludens76 el 01-07-2009 15:41 UTC
  18. #18   #16 Pensé que te habías vuelto hoygan y que ibas a poner:
    "HAJO y agua" XD XD
    votos: 3, karma: 53
    por miguelitor el 01-07-2009 15:41 UTC
  19. por --116310-- el 01-07-2009 15:53 UTC
  20. #20   Votamos copia/plagio?
    votos: 3, karma: 49
    por Maki_ el 01-07-2009 15:54 UTC
  21. por --116310-- el 01-07-2009 16:09 UTC
  22. #22   ¿Como funciona el sistema?
    votos: 2, karma: 22
    por chulonsky el 01-07-2009 16:14 UTC
  23. #23   Donde dije Diggo diggo Dieggo.
    votos: 1, karma: 21
    por edgard72 el 01-07-2009 16:14 UTC
  24. #24   Habís perdido un meneador :lol:
    votos: 2, karma: 31
    por filipo el 01-07-2009 16:18 UTC
  25. #25   Detecta urls idénticas...y el resto de features donde se las dejaron? Pffff yo creo que "programan" leyéndose el svn de menéame, a mí no me jodas.
    votos: 1, karma: 28
    por Taikochu el 01-07-2009 16:42 UTC
  26. #26   Aumenta el karma:

    * Votos positivos a tus noticias enviadas.
    * Votos positivos a noticias que han sido publicadas, siempre que el voto haya sido realizado antes de la publicación de la noticia.
    * Votos negativos a noticias que han sido descartadas, siempre que el voto haya sido realizado en los 15 minutos siguientes al envío de la noticia.
    * Votos positivos a tus comentarios.

    +

    Karmawhores

    =

    Sistema infalible antidupes ... :D
    votos: 6, karma: 48
    por InTheAciD el 01-07-2009 16:49 UTC
  27. #27   Epdigg fail
    votos: 0, karma: 9
    por Cocoman el 01-07-2009 16:55 UTC
  28. #28   Esto lo tiene menéame desde hace tiempo, lo dicen en los primeros comentarios y la noticia ha llegado a portada... ¿Algún sistema para evitar eso? Quizás sea mejor que lo de las duples :P
    votos: 1, karma: 13
    por herzeleyd el 01-07-2009 17:00 UTC
  29. #29   Tienen mania por usar mayusculas jaja
    votos: 0, karma: 7
    por perrida el 01-07-2009 17:00 UTC
  30. #30   Pues tanto como infalible... recuerdo una vez que otro usuario y yo se la colamos al buscadupes de Menéame sin darnos cuenta:

    Él mandó meneame.net/story/orgullo-prejuicio-nada-persuasion con el url www.lanacion.com.ar/nota.asp?nota_id=1011137

    Y luego yo envié meneame.net/story/como-debe-no-debe-ser-atencion-call-center con dirección www.lanacion.com.ar/opinion/nota.asp?nota_id=10111377

    Básicamente, al enviar la noticia con todos los metadatos, el buscador no la detectó como duplicada porque la dirección no era idéntica. Así que la infalibilidad es bastante discutible.
    votos: 0, karma: 19
    por Nirgal el 01-07-2009 17:37 UTC
  31. #31   y que sería meneame sin sus discusiones sobre dupes
    votos: 2, karma: 27
    por flashinghurt el 01-07-2009 17:43 UTC
  32. #32   El sistema para evitar historias duplicadas es este: img523.imageshack.us/img523/9661/diggnewdupecheck.png

    Y el usuario es quien decide si enviarla finalmente o no.
    votos: 1, karma: 19
    por posavasos el 01-07-2009 18:11 UTC
  33. #33   Va va, que no puedo resistirme a decirlo:

    Esto es inDIGGnante
    votos: 1, karma: 20
    por Cocoman el 01-07-2009 18:25 UTC
  34. #34   Parece que #22 es el unico comentario interesado por el tema que no ha hecho un chiste malo.

    En el Blog de digg explican en que consisten los nuevos mecanismos que estan desarrollando que NO se estan aplicando de momento.
    blog.digg.com/?p=866

    las nuevas soluciones corregiran casos en que se envia un link al mismo contenido pero con urls diferentes, mediante un algoritmo que compara la similitud entre contenidos.

    Y por otro lado intentan algo un poco mas complejo: detectar como duplicadas dos noticias que aunque no sean la misma traten sobre el mismo tema (esto parece mas complicado... ya veremos que tal funciona :)
    votos: 3, karma: 33
    por hildor el 01-07-2009 19:03 UTC
  35. #35   Es un problema muy grande. La base de datos de digg es monstruosa y analizar textos muy costoso.

    Evidentemente lo primero es buscar URL idénticas. Pero no es tan fácil, deben previamente ser canonicalizarlas de alguna manera para que sea efectivo. Y no es nada trivial, por ejemplo, ¿tenemos en cuenta subdominios o solo los de primer nivel? ¿quitamos las barras que sobran? provad esta URL:
    meneame.net////story/digg-estrena-sistema-infalible-para-evitar-envio-s
    ¿Raro, no? ¿Quitamos el #ancla? En algunas páginas, como la wikipedia llevarían a la misma página. En otras, donde son parámetros para el javascript/ajax de la página resultarían distintas (ej: facebook).

    Y eso es solo el paso más fácil. Yo seguramente seguiría buscando envios similares a través de las etiquetas, y por último analizar el título de las más probables, que siendo optimistas serían pocas noticias. Vamos, casi imposible.

    Reirme de los programadores de digg, me parece mal. Seguramente sean muy buenos, y han invertido un montón de tiempo y esfuerzo en esto, y seguramente ayude a evitar las duplicadas. Como uno del gremio, me compadezco por ellos por el escarnio público y el asegurado mal rollo en la oficina.
    votos: 1, karma: 17
    por kolme el 01-07-2009 19:18 UTC
  36. #36   Lo de sistema infalible...
    Menéame ya lo tiene y aún así se siguen subiendo las mismas noticias publicadas en otros medios...
    votos: 0, karma: 6
    por esperantisto el 01-07-2009 20:05 UTC
  37. #37   infalible mis bolainas, ayer mismos envié una historia que era dupe :-P
    votos: 1, karma: 40
    por holiveira el 01-07-2009 20:30 UTC
  38. #38   Sistema infalible? Nisiquiera es un sistema, es una única regla, es como decir que construyeron una casa cuando apenas acotaron el perímetro.
    votos: 0, karma: 6
    por Arth el 02-07-2009 00:46 UTC
  39. #39   Estamos rodeados de expertos, cualquiera programaría digg con los ojos cerrados, es increible :roll:
    votos: 1, karma: 26
    por chulonsky el 02-07-2009 07:17 UTC
comentarios cerrados

menéame