[c&p] En los últimos siete días, los datos acumulados en di66.net, han demostrado que el 46,6% de las noticias que llegan a la página principal de Digg provienen de solamente 50 sitios web. Los cambios recientes en las políticas y restricciones hechas por Digg para fomentar la diversidad de noticias en la primera página del sitio ha tenido dos resultados importantes. [Eng] Víahttp://alt1040.com/2009/03/el-46-de-la-pagina-principal-de-digg-es-controlada-por-50-webs
Porque las consultas fueron hechas con horas de diferencia entre el #3 y el #8
> Y aquí, es al revés: el 50% de la portada es "controlada" por 46 webs
Deberías calcular propocionales a la cantidad de sitios y envíos de cada uno para tener una idea mejor. En http://di66.net/top-sites-7d-by-posts.html sólo salen los del top... no se cuántas más hay. Pero sí, demasiados periódicos, los primeros 8 son periódicos "tradicionales". Y eso que hay límite en el número de envíos de cada fuente (con muchos "rechazos" por exceso), sería mucho peor sin ese límite.
Aunque también es cierto que en la blogocosa no se encuentran noticias ni demasiadas cosas interesantes más allá del frikismo usual
#10 Te dejo la de los últimos 30 días si quieres mirarlo, eso sería más aproximado a una semana de Digg (creo, es curioso la repetición del empate entre el mundo y el país):
#25 Ya está explicado en #24, cuando se envía un sitio se verifican varias cosas, entre ellas las direcciones RSS y se alamacena el "url más corto" para identificar a "sitios independientes" o el mismo sitio con diferentes dominios (por ejemplo con o sin el "www"), cada uno con su propio ID. Sino el control de diversidad de fuentes o bans a dominios completos afectaría a sitios independientes.
El código que lo hace: branches (mira analyze_html() o find_base_url()).
#21 Se hace así adrede para detectar sitios independientes con el mismo nombre de dominio (como muchos servicios de blogs). El path de esos viene determinado por el path del RSS si es que tienen.
#12 llegaste a la longitud máxima de comentario. He añadido una segunda hoja con la estadística mensual, y dos columnas: el porcentaje sobre el total, y la comparación con el otro periodo.
Curioso que el intervalo mensual, el 50% de portadas lo consiguen 25 medios, casi la mitad que antes. Estabilización de la "aletoriedad"
Los #N/A de la columna Pct1mes de la hoja 7dias imagino que serán los que se han cortado del comentario.
#14 por cierto, acabo de ver algunos datos incongruentes: algunas veces no se almacena correctamente _link_blog_. Fíjate que hay algunas direcciones que incluyen parte de la URL. Busca '/' en los sitios, aparecen varias.
No creo que afecte mucho, pero es posible que pueda afectar al listado de sitios más votados de la portada.
Mi humilde teoría es que tiene que ver con la naturaleza del sitio. Tanto Digg como Meneame son sitios de agregación de noticias con un cierto carácter... "generalista", si se me permite la comparación. Como dice perl en un comentario por ahí arriba (más o menos, está expresado de otra forma), fuera de los medios tradicionales se produce mucho de interés, pero repartido entre muchas páginas. Para que un medio de este tipo tenga mucha dispersión de fuentes, la gente que lo visita debería tener gustos mucho más diversos de lo que los tiene, o estar dedicado a la recolección de "noticias" de otro percal (estoy pensando en cuál será la dispersión para una página como SE, por ejemplo...)
#3 perl, desconozco cómo está organizada la base de datos de meneame, pero esas consultas no parecen tener sentido teniendo en cuenta el tema de esta noticia. Contarían www.dominio.com y www.dominio.com/loquesea como dos sitios distintos. A menos que estés guardando dominios y rutas por separado.
Comentarios
#1 Ya voy a hacer las estadísticas similares, pero lo rápido que hice ahora, en 7 días:
- Total de publicadas: 396
- Sitios diferentes: 242
Abajo los dos sql:
mysql> select count(*) from links where link_status='published' and link_date > date_sub(now(), interval 7 day);
+----------+
| count(*) |
+----------+
| 396 |
+----------+
1 row in set (0.00 sec)
mysql> select count(distinct link_blog) from links where link_status='published' and link_date > date_sub(now(), interval 7 day);
+---------------------------+
| count(distinct link_blog) |
+---------------------------+
| 242 |
+---------------------------+
1 row in set (0.00 sec)
#13 Disculpas, no me había dado cuenta, lo volví a hacer y está en 30.txt
Pero los datos salen distintos, el 50% de portadas se consiguen con los primeros 68 sitios del total de 777.
Pero curiosamente, los primeros 50 sitios hacen ¡el 46% de portadas! Clavado
Siguiendo con #3, esta es la tabla de la última semana:
: 4http://www.elmundo.es:21
http://www.elpais.com:21
http://www.20minutos.es:10
http://ecodiario.eleconomista.es:10
http://www.publico.es: 9
http://www.lavanguardia.es: 9
http://www.abc.es: 7
http://www.elperiodico.com: 7
http://www.cadenaser.com: 7
http://www.europapress.es: 7
http://www.soitu.es: 6
http://www.lavozdegalicia.es: 4
http://rayosycentellas.net: 3
http://www.rtve.es: 3
http://sp.rian.ru: 3
http://www.cotizalia.com: 3
http://www.dosmanzanas.com: 3
http://www.adn.es: 3
http://www.levante-emv.com: 3
http://www.maikelnai.es: 3
http://elsofista.blogspot.com: 3
http://aldea-irreductible.blogspot.com: 3
http://www.eleconomista.es: 2
https://www.facua.org/es: 2
http://www.univision.com: 2
http://www.gran-angular.net: 2
http://www.vertele.com: 2
http://www.eluniversal.com.mx: 2
http://www.larazon.es: 2
http://www.tendencias21.net: 2
http://arstechnica.com: 2
http://www.genbeta.com: 2
http://www.dailymail.co.uk: 2
http://www.elconfidencial.com: 2
http://www.cincodias.com: 2
http://www.antena3noticias.com: 2
http://blogs.20minutos.es/cronicaverde: 2
http://www.neoteo.com: 2
http://www.ecologistasenaccion.org: 2
http://paseandohistoria.blogspot.com: 2
http://www.diariocordoba.com: 2
http://www.libertaddigital.com: 2
http://www.boston.com/bigpicture: 2
http://www.heraldo.es: 2
http://bandaancha.eu: 2
http://www.infobae.com: 2
http://www.enriquedans.com: 2
http://www.cienciakanija.com: 1
http://elmilicianocnt-aitchiclana.blogspot.com: 1
http://blogs.publico.es/manel: 1
http://sdpnoticias.com: 1
http://www.pinknews.co.uk: 1
http://www.laopinioncoruna.es: 1
http://www.google.com: 1
http://desequilibros.blogspot.com: 1
http://nosolometro.blogspot.com: 1
http://www.canalsur.es: 1
http://www.webdesignerdepot.com: 1
http://www.cuatro.com: 1
http://www.360cities.net: 1
http://citius64.blogspot.com: 1
http://r0uzic.net: 1
http://www.laopinion.es: 1
http://www.extremadura24horas.com: 1
http://www.pinktentacle.com: 1
http://apurtu.org: 1
http://www.ojobuscador.com: 1
http://www.astronomybuff.com: 1
http://www.cabovolo.com: 1
http://www.delcastellano.com: 1
http://www.eldiarioexterior.com: 1
http://clitoris.lacoctelera.net: 1
http://blogs.publico.es/apuntesperipateticos: 1
http://actualidad.terra.es: 1
http://www.deminorias.com: 1
http://www.ansa.it: 1
http://servicios.elcorreodigital.com: 1
http://davidbravo.es: 1
http://www.narizpuntiaguda.com: 1
http://www.eurekalert.org: 1
http://www.radionetherlands.nl: 2
http://www.brisbanetimes.com.au: 1
http://www.noticias24.com/lifestyle: 1
http://www.consumer.es: 1
http://www.meristation.com: 1
http://www.elotrolado.net: 1
http://eltamiz.com: 1
http://www.bringdownie6.com: 1
http://www.laopiniondemalaga.es: 1
http://cinefagos.wordpress.com: 1
http://www.newsobserver.com: 1
http://www.marca.com: 1
http://www.gentedigital.es: 1
http://www.thrfeed.com: 1
http://www.thisislondon.co.uk: 1
http://www.toxel.com: 1
http://www.thisisnottingham.co.uk: 1
http://www.xlsemanal.com: 1
http://kurioso.wordpress.com: 1
http://hipocausto.blogspot.com: 1
http://www.as.com: 1
http://www.negocios.com: 1
http://www.movilonia.com: 1
http://www.lanacion.com.py: 1
http://www.quesabesde.com: 1
http://dividiendoentrecero.blogspot.com: 1
http://www.vayatele.com: 1
http://www.hola.com: 1
http://www.ruiningtheinternet.com: 1
http://sobreleyendas.com: 1
http://vicisitudysordidez.blogspot.com: 1
http://eltamiz.com/elcedazo: 1
http://crisei.blogalia.com: 1
http://podem.cat: 1
http://elzo-meridianos.blogspot.com: 1
http://www.vnunet.es: 1
http://www.fabio.com.ar: 1
http://cbs2chicago.com: 1
http://www.universetoday.com: 1
http://www.olgui.com: 1
http://www.lacapital.com.ar: 1
http://donklephant.com: 1
http://noticias.universogay.com: 1
http://www.samuelparra.com: 1
http://guerraypaz.com: 1
http://www.diariodesevilla.es: 1
http://query.nytimes.com: 1
http://elchistedemel.blogspot.com: 1
http://francisthemulenews.wordpress.com: 1
http://www.elpunt.cat: 1
http://es.noticias.yahoo.com: 1
http://mejorarelsistema.blogspot.com: 1
http://cienciadebolsillo.com: 1
http://teleobjetivo.org: 1
http://www.abadiadigital.com: 1
http://teslabs.com/meteotek08: 1
http://www.laopiniondegranada.es: 1
http://www.marketwatch.com: 1
http://graphjam.com: 1
http://www.santiagosiete.es: 1
http://www.siliconnews.es: 1
http://www.diariomotor.com: 1
http://aleixsalo.blogspot.com: 1
http://www.teknoconsolas.es: 1
http://news.soliclima.com: 1
http://www.atlantico.net: 1
http://www.time.com: 1
http://www.tuplanet.com: 1
http://blog.damelavoz.es: 1
http://www.telegraph.co.uk/news/worldnews/europe/vaticancityandh: 1
http://news.aol.com: 1
http://www.ecancermedicalscience.com: 1
http://firmas.org: 1
http://www.news.com.au: 1
http://xkcd.com: 1
http://www.nasa.gov: 1
http://www.adslzone.net: 1
http://www.telegraph.co.uk/finance/personalfinance/borrowing/mor: 1
http://www.madridiario.es: 1
http://exgae.net: 1
http://www.lahaine.org: 1
: 1
http://eltelefonoverde.wordpress.com: 1
http://www.spokesman.com: 1
http://www.juliangallo.com.ar: 1
http://www.japantoday.com: 1
http://thebigfoto.com: 1
http://www.elperiodicodearagon.com: 1
http://www.sinoescoma.es: 1
http://materialtv.wordpress.com: 1
http://www.diariosigloxxi.com: 1
http://www.jornada.unam.mx: 1
http://www.foropolicia.es: 1
http://www.telegraph.co.uk/earth/wildlife: 1
http://www.tiempodehoy.com: 1
http://www.telegraph.co.uk: 1
: 1
: 1
http://mangasverdes.es: 1
http://www.diariodemallorca.es: 1
http://noticias.prodigy.msn.com: 1
http://www.vidaextra.com: 1
http://mercedespaton.blogspot.com: 1
http://www.oddee.com: 1
http://www.animanaturalis.org: 1
http://www.energiadiario.com: 1
http://blogs.publico.es/eldedoenlallaga: 1
http://www.telegraph.co.uk/news/newstopics/howaboutthat: 1
http://www.lanacion.es: 1
http://www.lavozdeasturias.es: 1
http://www.metro.co.uk: 1
http://www.ahorrodiario.com: 1
http://mizar.blogalia.com: 1
http://www.pascualserrano.net: 1
http://www.canalpda.com: 1
http://www.susanamoo.com: 1
http://porantonomasia.wordpress.com: 1
http://www.que.es: 1
http://www.laverdad.es/murcia: 1
: 1
http://elnuevoherald.com: 1
http://fogonazos.blogspot.com: 1
http://www.expansion.com: 1
http://www.acam.es: 1
http://picasaweb.google.es: 1
http://www.sabercurioso.com: 1
http://www.fotografias.net: 1
http://englishrussia.com: 1
http://noticiasinteresantes.blogcindario.com: 1
http://www.blogoff.es: 1
http://www.noticiasdelcosmos.com: 1
http://www.ipsnoticias.net: 1
http://www.spanish.xinhuanet.com: 1
http://www.inggenia.com.ar: 1
http://hacktivistas.net: 1
http://www.washingtonpost.com: 1
http://lta.reuters.com: 1
http://roblesyvinos.blogspot.com: 1
http://www.todoababor.es: 1
http://www.discapnet.es: 1
http://www.pymesyautonomos.com: 1
http://www.lne.es: 1
http://www.latimes.com: 1
http://i.gizmodo.com: 1
http://www.zenit.org: 1
http://www.yupimail.com.ar: 1
http://noticias.terra.com: 1
http://86400.es: 1
http://www.sacbee.com/static/weblogs/photos: 1
http://lahistoriaconmapas.blogspot.com: 1
http://xn--slo-gna.es/yahooygan: 1
http://www.lefigaro.fr: 1
http://www.angelfire.com: 1
http://www.internautas.org: 1
http://www.tiempodeculto.com: 1
http://www.weblog.com.ar: 1
http://www.larioja.com: 1
http://www.emol.com: 1
http://tejiendoelmundo.wordpress.com: 1
Las de meneame están controladas por El Pais, el Mundo y el 20 Minutos.
Ah! Y fogonazos!
#10
> Me salen 241 sitios.
Porque las consultas fueron hechas con horas de diferencia entre el #3 y el #8
> Y aquí, es al revés: el 50% de la portada es "controlada" por 46 webs
Deberías calcular propocionales a la cantidad de sitios y envíos de cada uno para tener una idea mejor. En http://di66.net/top-sites-7d-by-posts.html sólo salen los del top... no se cuántas más hay. Pero sí, demasiados periódicos, los primeros 8 son periódicos "tradicionales". Y eso que hay límite en el número de envíos de cada fuente (con muchos "rechazos" por exceso), sería mucho peor sin ese límite.
Aunque también es cierto que en la blogocosa no se encuentran noticias ni demasiadas cosas interesantes más allá del frikismo usual
#10 Te dejo la de los últimos 30 días si quieres mirarlo, eso sería más aproximado a una semana de Digg (creo, es curioso la repetición del empate entre el mundo y el país):
25http://www.elmundo.es 91
http://www.elpais.com 91
http://www.publico.es 46
http://ecodiario.eleconomista.es 46
http://www.europapress.es 43
http://www.lavanguardia.es 37
http://www.20minutos.es 33
http://www.cadenaser.com 30
http://www.lavozdegalicia.es 25
http://www.soitu.es 24
http://www.elperiodico.com 21
http://www.abc.es 21
http://www.levante-emv.com 17
http://www.elconfidencial.com 16
http://www.que.es 13
http://www.adn.es 13
http://www.dailymail.co.uk 13
http://www.elplural.com 12
http://www.rtve.es 12
http://www.libertaddigital.com 11
http://es.noticias.yahoo.com 11
http://www.eleconomista.es 9
http://www.larazon.es 9
http://www.univision.com 9
http://www.heraldo.es 9
http://www.diariosur.es 8
http://www.marca.com 8
http://www.expansion.com 8
http://rayosycentellas.net 7
http://www.elcorreogallego.es 7
http://news.bbc.co.uk 7
http://fogonazos.blogspot.com 7
http://www.vertele.com 7
http://www.as.com 6
http://bandaancha.eu 6
http://www.cotizalia.com 6
http://www.adslzone.net 6
http://www.eluniversal.com.mx 6
http://dividiendoentrecero.blogspot.com 5
http://aldea-irreductible.blogspot.com 5
http://porantonomasia.wordpress.com 5
http://www.cincodias.com 5
http://eltamiz.com/elcedazo 5
https://www.facua.org/es 5
http://www.lne.es 5
http://sp.rian.ru 5
http://actualidad.terra.es 5
http://kurioso.wordpress.com 5
http://www.internautas.org 4
http://www.elperiodicoextremadura.com 4
http://www.neoteo.com 4
http://www.diariodemallorca.es 4
http://www.oddee.com 4
http://www.dosmanzanas.com 4
http://www.google.com 4
http://www.porandalucialibre.es 4
http://www.boston.com/bigpicture 4
http://www.larepublica.es 4
http://francisthemulenews.wordpress.com 4
http://www.antena3noticias.com 4
http://blogs.publico.es/manel 4
http://www.hoy.es 4
http://www.tendencias21.net 4
http://www.laopinioncoruna.es 4
http://www.diariodesevilla.es 4
http://www.emol.com 4
http://mangasverdes.es 4
http://www.newscientist.com 4
http://desequilibros.blogspot.com 4
http://www.diarioinformacion.com 4
http://www.diariosigloxxi.com 4
http://torrentfreak.com 4
http://historiasconhistoria.es 3
http://www.gran-angular.net 3
http://www.flickr.com 3
http://www.hispanidad.com 3
http://www.xornal.com 3
http://www.infobae.com 3
http://www.theinquirer.es 3
http://www.microsiervos.com 3
http://www.genciencia.com 3
http://www.laverdad.es/murcia 3
http://www.telegraph.co.uk 3
http://blogs.periodistadigital.com 3
http://www.cuatro.com 3
http://www.abadiadigital.com 3
http://www.ecologistasenaccion.org 3
http://xataka.com 3
http://www.pinknews.co.uk 3
http://elsofista.blogspot.com 3
http://cracked.com 3
http://www.farodevigo.es 3
http://www.plataformasinc.es 3
http://101lugares.blogspot.com 3
http://www.elperiodicomediterraneo.com 3
http://madridmemata.es 3
http://www.maikelnai.es 3
http://www.latimes.com 3
http://www.negocios.com 3
http://noticias.universogay.com 3
http://www.mimesacojea.com 3
http://fotosdetiempospasados.blogspot.com 3
http://www.diariocordoba.com 3
http://www.jornada.unam.mx 3
http://gmailblog.blogspot.com 3
http://www.escolar.net 3
http://www.diariocritico.com 3
http://blogs.20minutos.es/cronicaverde 3
http://www.laopinion.es 3
http://www.ipsnoticias.net 3
http://www.3cat24.cat 3
http://www.kaosenlared.net 3
http://www.estrelladigital.es 3
http://historiasdelahistoria.com 3
http://noticias.terra.com 3
http://www.cienciakanija.com 3
http://www2.lavoz.com.ar 3
http://gafasdenover.blogspot.com 3
http://www.vnunet.es 3
http://www.elcomercio.com.pe 3
http://teleobjetivo.org 3
http://www.interviu.es 2
http://www.sltrib.com 2
http://www.elconfidencialdigital.com 2
http://www.zonafirefox.net 2
http://www.toxel.com 2
http://www.laopiniondezamora.es 2
http://www.233grados.com/blog 2
http://www.samuelparra.com 2
http://www.alsd.es 2
http://www.cabovolo.com 2
http://www.noticias24.com/actualidad 2
http://www.telegraph.co.uk/news/newstopics/howaboutthat 2
http://matiascallone.blogspot.com 2
http://es.reuters.com 2
http://www.invertia.com 2
http://www.theregister.co.uk 2
http://www.consumer.es 2
http://www.losandes.com.ar 2
http://wtf.microsiervos.com 2
http://www.telegraph.co.uk/earth/wildlife 2
http://www.laopiniondegranada.es 2
http://www.lanacion.es 2
http://www.radiocable.com 2
http://elbauldejosete.wordpress.com 2
http://www.deia.com 2
http://madriddigital.info 2
http://www.genbeta.com 2
http://www.lavozdeasturias.es 2
http://itgirl.wordpress.com 2
http://cienciadebolsillo.com 2
http://86400.es 2
http://thebigfoto.com 2
http://www.milenio.com 2
http://www.elcorreodigital.com/alava 2
http://www.pymesyautonomos.com 2
http://www.meristation.com 2
http://www.euronews.net 2
http://www.kriptopolis.org 2
http://www.ansa.it 2
http://i.gizmodo.com 2
http://www.filmica.com/david_bravo 2
http://www.elotrolado.net 2
http://elzo-meridianos.blogspot.com 2
http://www.sport.es 2
http://www.tuexperto.com 2
http://www.explosm.net 2
http://arstechnica.com 2
http://www.laprovincia.es 2
http://eltamiz.com 2
http://www.consumerist.com 2
http://www.noticiasdelcosmos.com 2
http://www.timesonline.co.uk/tol 2
http://uk.reuters.com 2
http://www.blogoff.es 2
http://paseandohistoria.blogspot.com 2
http://lapulgasnob.blogspot.com 2
http://www.clarin.com 2
http://www.energias-renovables.com 2
http://www.thesun.co.uk 2
http://www.ausbanc.es 2
http://www.xlsemanal.com 2
http://www.elperiodicodearagon.com 2
http://muchachadanui.rtve.es 2
http://www.nopuedocreer.com/noticias 2
http://www.gentedigital.es 2
http://www.lostiempos.com 2
http://www.elcomerciodigital.com/gijon 2
http://www.papelenblanco.com 2
http://englishrussia.com 2
http://www.elcorreodigital.com/vizcaya 2
http://www.acam.es 2
http://www.laflecha.net 2
http://www.vayatele.com 2
http://www.enriquedans.com 2
http://www.clarin.com/diario 2
http://neofronteras.com 2
http://www.europasur.es 2
http://soyplastic.net 1
http://www.agujero.com 1
http://sdpnoticias.com 1
http://www.humorporhoras.com 1
http://www.extremadura24horas.com 1
http://mallos.es 1
http://www.vialibre-ffe.com 1
http://servicios.elcorreodigital.com 1
http://www.newsobserver.com 1
http://www.funniez.net 1
http://www.noticiasdot.com 1
http://www.astronomybuff.com 1
http://www.obsoletos.org 1
http://cinemascope35.blogspot.com 1
http://exapamicron.wordpress.com 1
http://www.dailywealth.com 1
http://www.rebelion.org 1
http://tech.blorge.com 1
http://slideshare.net 1
http://www.vidadeunconsultor.com 1
http://geekinlove.com 1
http://cache.boston.com 1
http://www.laredgualda.com 1
http://www.periodicodigital.com.mx 1
http://periodistasenguerra.blogspot.com 1
http://www.internetsonlospadres.com 1
http://www.somarda.com 1
http://www.granadadigital.com 1
http://www.crisisenergetica.org 1
http://www.tiempodehoy.com 1
http://blogs.publico.es/mauroentrialgo 1
http://www.spanish.xinhuanet.com 1
http://www.msnbc.msn.com 1
http://www.lacapital.com.ar 1
http://www.sacbee.com/static/weblogs/photos 1
http://www.berria.info 1
http://www.dezeen.com 1
http://www.ahorrodiario.com 1
http://www.elpais.com.uy 1
http://www.fotografias.net 1
http://www.laverdad.es/albacete 1
http://mercedespaton.blogspot.com 1
http://www.solociencia.com 1
http://www.susanamoo.com 1
http://www.expasy.ch 1
http://channel.nationalgeographic.com 1
http://www.hongkiat.com/blog 1
http://www.invernews.com 1
http://demonicious.com 1
http://www.parcero.com 1
http://www.ipodizados.com 1
http://www.ambienteg.com 1
http://www.asc-csa.gc.ca 1
http://www.comfia.info 1
http://sovietrussia.org 1
http://empollonintegrista.wordpress.com 1
http://spaceflightnow.com 1
http://blogs.20minutos.es/revelados 1
http://www.blogatclock.net 1
http://www.kirainet.com 1
http://www.animanaturalis.org 1
http://www.telegraph.co.uk/news/worldnews/northamerica/usa 1
http://www.universetoday.com 1
http://www.noticias24.com/lifestyle 1
http://captchafobia.blogspot.com 1
http://www.neatorama.com 1
http://www.teknoconsolas.es 1
http://citius64.blogspot.com 1
http://www.tecnorantes.com 1
http://www.elblogmasfamoso.com 1
http://www.deminorias.com 1
http://teslabs.com/meteotek08 1
http://tt.com 1
http://www.tuplanet.com 1
1
http://www.amazings.com 1
http://elchistedemel.blogspot.com 1
http://exopus.wordpress.com 1
http://mafiainmobiliaria.com 1
http://agaudi.wordpress.com 1
http://bergercartoons.com 1
http://acidcow.com 1
http://www.e-noticies.es 1
http://mecongratula.es 1
http://www.eldiariomontanes.es 1
http://www.diariodejerez.es 1
http://www.campodemarte.com 1
http://blogs.expansion.com 1
http://sinergiasincontrol.blogspot.com 1
http://pedrohernandezabogado.blogspot.com 1
http://foto.microsiervos.com 1
http://eco.microsiervos.com 1
http://neanderthalis.blogspot.com 1
http://weblog.greenpeace.org 1
http://www.caracol.com.co 1
http://goiena.net 1
http://cruzarlosdedos.blogspot.com 1
http://www.energiadiario.com 1
http://ricoestofado.blogspot.com 1
http://www.wwf.es 1
http://blogs.publico.es/eldedoenlallaga 1
http://www.diariocriticocv.com 1
http://www.inggenia.com.ar 1
http://www.darkroastedblend.com 1
http://www.nasa.gov 1
http://prosopopeyadivagante.blogspot.com 1
http://www.rrhhdigital.com 1
http://www.sinoescoma.es 1
http://podem.cat 1
http://www.darkreading.com 1
http://query.nytimes.com 1
http://www.epsilones.com 1
http://www.quesabesde.com 1
http://perezhilton.com 1
http://www.nohayrosasinespina.com 1
http://www.asueldodemoscu.net 1
http://www.voltairenet.org 1
1
http://www.correoandalucia.com 1
http://ramenparados.blogspot.com 1
http://www.alhambra-patronato.es 1
http://w
El 46% de la portada de Menéame es controlada por la mafia
En esto no se cumple la famosa regla 80-20 de Pareto:
http://es.wikipedia.org/wiki/Vilfredo_Pareto
¿Y rebelion.org+kaosenlared+alasbarricadas? ¿cuánto controla?
#25 Ya está explicado en #24, cuando se envía un sitio se verifican varias cosas, entre ellas las direcciones RSS y se alamacena el "url más corto" para identificar a "sitios independientes" o el mismo sitio con diferentes dominios (por ejemplo con o sin el "www"), cada uno con su propio ID. Sino el control de diversidad de fuentes o bans a dominios completos afectaría a sitios independientes.
El código que lo hace: branches (mira analyze_html() o find_base_url()).
#21 Se hace así adrede para detectar sitios independientes con el mismo nombre de dominio (como muchos servicios de blogs). El path de esos viene determinado por el path del RSS si es que tienen.
Que se den con un canto en los dientes. El 99% de la portada de meneame es controlada por 50 mafiosos
#12 llegaste a la longitud máxima de comentario. He añadido una segunda hoja con la estadística mensual, y dos columnas: el porcentaje sobre el total, y la comparación con el otro periodo.
Curioso que el intervalo mensual, el 50% de portadas lo consiguen 25 medios, casi la mitad que antes. Estabilización de la "aletoriedad"
Los #N/A de la columna Pct1mes de la hoja 7dias imagino que serán los que se han cortado del comentario.
#8 http://spreadsheets.google.com/ccc?key=pMWEBOE4GPWyRiWwjC64FRw Me salen 241 sitios. Y aquí, es al revés: el 50% de la portada es "controlada" por 46 webs.
#14 ¿Qué demonios?
Menéame has evolved into Digg...
¿Tendrá algo que ver el código o simple casualidad?
Muy bueno este post para saber las estadisticas de meneame
1# 2#
Tened cuidado que igual os aparece una cabeza de caballo en vuestra cama
Es logico que empresas se interesen en publicitarse de manera gratuita en paginas con muchos visitantes...y si lo pueden hacer desde dentro mejor
Errónea. El 46% de la portada de Digg está controlada por la mafia de Meneame
#16 He pensado lo mismo. Con todos los comentarios de #3 #8 (bueno todos los de perl) me he enterado de las de menéame. Gracias
#14 añadidos todos.
Para quienes tengan cuenta de Google:
http://spreadsheets.google.com/ccc?key=pMWEBOE4GPWyRiWwjC64FRw
Como página web:
http://spreadsheets.google.com/pub?key=pMWEBOE4GPWyRiWwjC64FRw
#14 por cierto, acabo de ver algunos datos incongruentes: algunas veces no se almacena correctamente _link_blog_. Fíjate que hay algunas direcciones que incluyen parte de la URL. Busca '/' en los sitios, aparecen varias.
No creo que afecte mucho, pero es posible que pueda afectar al listado de sitios más votados de la portada.
Digg es un saco!!!
de como conseguir que los comentarios de una noticia que habla de digg, hablen de meneame ...
cool, según #8 soy parte de la mafia de menéame! ya lo decía yo por mi apellido italiano.
Mi humilde teoría es que tiene que ver con la naturaleza del sitio. Tanto Digg como Meneame son sitios de agregación de noticias con un cierto carácter... "generalista", si se me permite la comparación. Como dice perl en un comentario por ahí arriba (más o menos, está expresado de otra forma), fuera de los medios tradicionales se produce mucho de interés, pero repartido entre muchas páginas. Para que un medio de este tipo tenga mucha dispersión de fuentes, la gente que lo visita debería tener gustos mucho más diversos de lo que los tiene, o estar dedicado a la recolección de "noticias" de otro percal (estoy pensando en cuál será la dispersión para una página como SE, por ejemplo...)
#3 perl, desconozco cómo está organizada la base de datos de meneame, pero esas consultas no parecen tener sentido teniendo en cuenta el tema de esta noticia. Contarían www.dominio.com y www.dominio.com/loquesea como dos sitios distintos. A menos que estés guardando dominios y rutas por separado.
Pregunta genuina :?
Aclarado, gracias
Sólo el 46%?
Tiempo despues los usuarios comenzaran a visitar mejor los ditios de donde provienen mas las noticias y paulatinamente abandonaran meneame.