Eli
369meneos

¿Para cuándo un buscador libre? [EN]

Si los buscadores vienen a ser el sistema operativo de Internet, la falta de un buscador libre equivaldría a la ausencia de un Linux como alternativa a sistemas operativos propietarios como Windows. Estando como estamos en manos de multinacionales a la hora de buscar en la web, quizás es hora de plantearnos la consecución de un sistema alternativo. ¿Para cuándo un buscador libre que sea una alternativa real a Google? En este artículo se resume la situación actual y se proponen los pasos a seguir para lograrlo. Traducción: fon.gs/busc

votos negativos: 3  usuarios: 194  anónimos: 175  
  1. #1   ¿nutch?
    votos: 5, karma: 19
    por bewog el 22-10-2007 21:24 UTC
  2. #2   #1 Mencionado está en el artículo.
    votos: 2, karma: 33
    por tigre_siberiano el 22-10-2007 21:26 UTC
  3. #3   En cuanto a los sistemas operativos, libre suele ser sinónimo de mejor... Pero no tiene que pasar lo mismo con los buscadores. Hoy por hoy creo que google nunca me ha fallado...
    votos: 9, karma: -27
    por ajripa el 22-10-2007 21:36 UTC
  4. #4   ¿Para dentro de unos meses?
    google.dirson.com/post/3360-wales-wikipedia-jabber-abierto/
    Jimmy Wales (Wikipedia) ficha al creador de Jabber para un buscador "de código abierto, transparente y colaborativo"
    votos: 5, karma: 46
    por kaleborroka el 22-10-2007 21:52 UTC
  5. #5   #1/#4 Para ser correctos, debería haber titulado la noticia algo parecido a: "¿Para cuándo un buscador libre que sea una alternativa real a Google?" Pero quizás habría sido algo kilométrico... (De hecho el artículo se titula "Where's the open source distributed search?" ).

    PD: Si alguien propone un título más acertado, estaré encantado de editarlo.
    votos: 1, karma: 25
    por tigre_siberiano el 22-10-2007 22:06 UTC
  6. #6   Edito la entradilla incorporando lo que comento en #5, confiando mejorarla :-|
    votos: 1, karma: 25
    por tigre_siberiano el 22-10-2007 22:21 UTC
  7. #7   Un buscador esta formado por el software que utiliza pero tambien por la empresa que pone centros de computacion y almacenamiento y que además lo da a conocer. Lo primero ya existe, lo segundo no se me ocurre como.
    votos: 3, karma: 28
    por brainsqueezer el 22-10-2007 23:25 UTC
  8. #8   Mucho que ganar. Sobretodo cuando la ley obligue a dar los datos de todas las búsquedas de cada persona. Ninguna empresa se podrá resistir.

    Lo suyo creo yo es una especie de p2p buscador. Tu guardas ciertos indices en tu PC que a la vez están distribuidos en muchos ordenadores más. Algunos ciclos de CPU se usan en 2º plano cuando está libre el procesador, etc...Redundando mucho puedes conseguir fiabilidad y potencia.
    Además encriptado y anónimo.
    votos: 6, karma: 47
    por fifodoble el 23-10-2007 00:36 UTC
  9. votos: 13, karma: -113
    por pordi el 23-10-2007 09:36 UTC
  10. #10   #7 Con computación distribuida, usando una red p2p para el escaneo de la red y usando los recursos del usuario para crear una base de datos común.

    Usando ese concepto sobra potencia de cálculo y sobra velocidad de acceso a la red.

    Debería ser una bbdd distribuida (la de google lo es) y replicada de forma que aunque muchos usuarios no estuvieran online el buscador siguiera funcionando correctamente.

    No es, para nada, trivial pero el camino parece que es ese.
    votos: 1, karma: 15
    por sorrillo el 23-10-2007 18:56 UTC
  11. #11   Ya que el artículo va de libertad, por que no sustituir Linux por GNU/Linux y propietario por privativo? :)
    votos: 3, karma: 13
    por quidam el 23-10-2007 21:30 UTC
  12. por --1341-- el 23-10-2007 23:54 UTC
  13. #13   #10 ¿y como andaría de latencia?, me explico. Puede existir un índice general que lo contenga un servidor donde se anota quien tiene qué y quien está conectado para cuando tu pidas algo el servidor te lleve directamente a quién lo tiene.

    O puede no existir ninguno y preguntar a toda la red "¿quien tiene esto?".

    A lo primero, el índice sería bastante grande y los recursos que consumiría también por lo que a ver quien lo paga.
    A lo segundo, preguntar a toda la red ¿no tendría un poco de retardo?. No es lo mismo ir a tiro fijo que ir "a ciegas".

    Quizás me equivoque pero así lo veo.
    votos: 1, karma: 18
    por kadmon el 24-10-2007 08:46 UTC
  14. #14   El problema principal es que un buscador depende de una infraestructura de ordenadores muy grande con mucha potencia de calculo etc etc Al final cualquiera podría montar su propio buscador,pero no todo el mundo podría mantener el coste de la infraestructura...
    votos: 2, karma: 6
    por yusexp el 24-10-2007 09:03 UTC
  15. #15   un buscador que permita a los usuarios valorar el contenido de los enlaces, como un meneame de las busquedas.

    Y los costes me imagino que con la publicidad se pagan casi solos.
    votos: 0, karma: 6
    por pancha el 24-10-2007 09:17 UTC
  16. #16   No hay que olvidar que Google tiene una infraestructura de unos 8000 computadoras en 3 centros de EEUU, o por lo menos hace unos años era así. Posiblemente, ahora serán más para indexar cada vez más páginas (andaban por los 3.000 millones de documentos).Esa infraestructura es muy difícil llevarla a cabo por un proyecto libre, ya que las donaciones no alcanzan a tanta pasta.

    Quizás algún sistema basado en redes P2P, como he visto que han apuntado por ahí (#8). Algo tipo SETI, aprovechando los tiempos ociosos de las CPUs. En definitiva, un sistema basado en búsquedas distribuidas. Pero, inevitablemente luego necesitas una infraestructura gigante para procesar datos, alamacenarlos y servirlo...  » ver todo el comentario
    votos: 4, karma: 17
    por ddreams el 24-10-2007 09:26 UTC
  17. #17   #16: Iba a rebatirte el primer párrafo, pero veo que te contestas en el segundo.

    Si no existe aún yo creo que es más porque hasta ahora ha habido otras necesidades más importantes en las que invertir esfuerzos y google ha hecho hasta ahora razonablemente bién su trabajo (recordemos que es un servicio, no un software que distribuya y por lo tanto es éticamente correcto, como mínimo en ese punto).

    Pero cuando aparezca un sistema de búsqueda colaborativo y empiece a funcionar bién, google tiene los dias contados. Y si no tiempo al tiempo...
    votos: 0, karma: 8
    por joanmi el 24-10-2007 10:50 UTC
  18. #18   no le veo ningun sentido a un "buscador p2p", pero bueno..... si esta apagado mi ordenador, mi parte de la bbdd no tendrian acceso lo0s demas, me ocuparia espacio a mi y recursos de mi ordenador, y encima si formateo, lo que ha hecho mi ordenador se va a tomar vientos. Un buscador libre... no se, me parece perder el tiempo, como KDE para windows y macs, si destinase ese recurso a lo que se esta haciendo ahora que por ejemplo la wikipedia no va precisamente sobrada de recursos, ganariamos todos

    como he visto en los demas comentarios, me votareis negativos por decir subliminalmente que con googlo (por ejemplo) nos vasta, porque #3 y #16 han hecho spam o insultado pa ganarse esos negativos?.......¬¬
    votos: 0, karma: 6
    por Neofito el 24-10-2007 11:04 UTC
  19. #19   #3 Hasta que un día te digan "ahora tienes que pagar una cuota para que siga yendo igual de bien".
    votos: 0, karma: 8
    por tuseeketh el 24-10-2007 11:15 UTC
  20. #20   #16 No necesitas que nada este centralizado ("infraestructura gigante para procesar datos"), ni siquiera los que contengan los indices de las busquedas.

    Usando resolucion DNS dinamica un equipo podria encargarse de distribuir las busquedas hacia distintos servidores de indices y en funcion de la zona geografica. Tu equipo estaria consultando al indice mas cercano, que podria ser incluso dentro de tu propio ISP.

    Todo podria ser redundante, por lo que la caida de ciertos ordenadore o miles de ellos no seria para nada grave, otros tomarian el relevo.

    Las velocidades actuales (+20 Mbps son normales en la mayoria de paises civilizados) hace que el trafico necesario de replicaci...  » ver todo el comentario
    votos: 1, karma: 16
    por sorrillo el 24-10-2007 11:21 UTC
  21. #21   Un buscador nececesita una infraestructura carísima: datacenters, etc, para poder procesar las busquedas rápidamente.
    votos: 0, karma: 7
    por bimixo el 24-10-2007 11:35 UTC
  22. por --55261-- el 24-10-2007 13:15 UTC
  23. #23   #8 De dónde sacas esa información de que deberán dar datos de las búsquedas de cada persona? Quiero decir estás hablando hipotéticamente o hay algún proyecto en ciernes?
    votos: 0, karma: 6
    por Moss el 24-10-2007 13:16 UTC
  24. #24   Aunque técnicamente sea posible estaría la cuestión de la privacidad.
    ¿quién impediría que cualquier empresa utilizase la información de las búsquedas para cualquier fin?
    votos: 0, karma: 6
    por ibaed el 24-10-2007 13:19 UTC
  25. #25   #20 un equipo podria encargarse de distribuir las busquedas hacia distintos servidores

    Con equipo supongo que dices un buen ordenador, un servidor, vamos, que no te refieres a un equipo de personas.
    Para que algo haga de guía y redirija el tráfico debe de ser siempre el mismo y estar siempre localizable porque de otra forma habría que preguntar por ahí por él, no es plan, entonces mis preguntas son ¿ese servidor aguantará todo el tráfico que p ej tiene google?, ¿quien lo pagará?. Bueno, podría haber donaciones.

    Y mientras redirige para que hagamos la pregunta a la zona correspondiente un segundo se va, y mientras en esa zona se encuentra la respuesta concreta o...  » ver todo el comentario
    votos: 1, karma: 13
    por kadmon el 24-10-2007 16:32 UTC
  26. #26   #23 En Estados Unidos ya le pidieron a google,msn,y yahoo datos sobre las búsquedas,si mal no recuerdo google se negó a ofrecer dicha información...(hay una noticia al respecto por ahí)
    votos: 0, karma: 7
    por Nevershine el 24-10-2007 16:35 UTC
  27. #27   #25 efectivamente, no puedes aguantar con el 30% (o menos...) todas las busquedas, y aparte #20 20mbps en paises civilizados....pero es que esto es espIña xD 20 mbs no los tiene nadie, y encima de ancho cutre (sobre todo de subida y con la cantidad de datos que tienes que mandar..) si tengo el torrent abierto, vas a ver que risa te da....

    no lo veo viable, porque ademas alguien tendria que pagar una pagina web que mostrase las busquedas, porque en teoria mi ordenador en ese supuesto buscador p2p, solo serviria los datos, no se va a poner a hacer de servidor web
    votos: 0, karma: 6
    por Neofito el 24-10-2007 17:15 UTC
  28. #28   un buscador de código libre no creo que fuese muy productivo. Acabaría corrupto, pues sus resultados, conociendo su algoritmo de indexación sería más susceptible de ser manipulado y pudiese ser que acabase dando resultados que no queremos.

    Vamos eso creo yo, si ya pasa esto sin conocer del todo como funcionan (póngase cualquier nombre de software en google y vea como aparecen por encima de su pagina oficial paginas como softonic y similares)
    votos: 0, karma: 6
    por clinisbut el 24-10-2007 18:02 UTC
  29. #29   #25 Para argumentar mis comentarios hay que ir ya a muy bajo nivel y a discusiones muy técnicas. Te pongo un ejemplo de a lo que me refiero:

    Para que algo haga de guía y redirija el tráfico debe de ser siempre el mismo y estar siempre localizable porque

    Evidentemente alguien tiene que liderar el proyecto, el buscador requiere un registro dns (mibuscador.com). Ese registro DNS puede estar definido con 20 resoluciones distintas en 20 servidores "raíz" del buscador. Todos ellos solo tendrían que dirigir la consulta al ordenador mas próximo al usuario (por IP) y/o por laténcia.

    Te aseguro que ese trabajo lo puede hacer un Pentium a 1 G...  » ver todo el comentario
    votos: 0, karma: 7
    por sorrillo el 24-10-2007 19:10 UTC
  30. #30   #29 no se si aguantan 20 pentium a 1ghz todo el trafico de google (me refiero a las peticiones dns), ten encuenta que es un trafico bestial, yo todos los dias uso varias veces google, y como yo practicamente todos los internautas
    votos: 0, karma: 6
    por Neofito el 24-10-2007 22:12 UTC
  31. #31   Para mi el problema es el hardware. Para hacer algo similar a Google se necesitan varios miles de ordenadores conectados a varios miles de sistemas de almacenamiento de alta capacidad.
    votos: 0, karma: 6
    por flexar el 24-10-2007 22:42 UTC
  32. #32   #29 Pero google no pone el bittorrent a funcionar en sus ordenadores ni se pone a ripear una película que consume todos los recursos y sus conexiones son un poco mejores que las de la mayoría, así también tiene ordenadores con su SO específico adaptado a sus necesidades y los encargados de eses ordenadores son técnicos, no gente normal. ¿cuantos de los voluntarios van a dejar un ordenador exclusivamente para el buscador libre? pues entre que unos lo tienen apagado, otros que ripean una peli, otros que ven porno y ocupan la conexión, otros que ponen la mula o el bittorrent... por muy redundante que sea la BDD parece que casi no quedan ordenadores 100% aprovechables.

    Puede funcionar, con "pocas" visitas pero ¿realmente aguantará lo que aguanta Google?, si no aguanta lo que aguanta google difícilmente podra competir con él y si no compite pasará a ser un proyecto más: Firefox vs IE, Linux vs Windows, Openoffice vs MOffice... por mucho aprecio que le tenga al Firefox, el IE le gana por goleada.
    votos: 0, karma: 7
    por kadmon el 25-10-2007 08:17 UTC
comentarios cerrados

menéame