Eli

      
encontrados: 25, tiempo total: 0.008 segundos rss2
12meneos

OCR online gratis

Para convertir textos escaneados en copias editables, gratis. OnlineOCR es un genial programa que te permite convertir una imagen en un texto editable

23meneos

El mundo del OCR en el software libre

...me dispuse a informarme sobre software OCR libre… y mi decepción fue mayúscula cuando nada bueno encontraba. Todo lo que leia era la pésima situación del OCR para Linux y el software libre bla bla bla. Seguí buscando y acabé haciendo una lista de todos los programas que había encontrado...

149meneos

Google hace open source un soft OCR

En inglés. Tesseract OCR, un soft de OCR desarrollado por los laboratorios de HP entre 1985 y 1995, ha sido retomado por Google que ha corregido algunos bugs importantes, y lo ha publicado en sourceforge bajo una licencia libre. No es apto para documentos demasiado complejos, y sólo funciona en inglés, pero en Google afirman que es el OCR open source más preciso existente en la actualidad. Como dato adicional, la entrada dice que en Google buscan buenos ingenieros OCR (para contratarlos).

17meneos

(EN) Análisis de los principales OCR para GNU/Linux

Un programa OCR (Reconocimiento Óptico de Caracteres) sirve para hacer editable un texto desde un fichero de imagen de puntos (bitmap). En este artículo podemos ver cómo se comportan algunos de estos programas, entre ellos tenemos al famoso Tesseract meneame.net/story/google-hace-open-source-soft-ocr

81meneos

OCR libre en Ubuntu, Windows y próximamente en GNU/Linux y Mac OS X

El programa tesseract-ocr fue comprado por Google a HP hace varios años y la verdad es que reconoce incluso el texto en varias columnas, cosa que ni la versión 7 del famoso software de reconocimiento óptico de caracteres (OCR) de Adobe es capaz de hacer.

1OCR libre en Ubuntu, Windows y próximamente en GNU/Linux y Mac OS X ¿Desde cuándo Ubuntu no es GNU/Linux?...
66meneos

OCR gratuito con Gmail

Gmail nos ofrece un sistema de OCR gratuito a través de los archivos adjuntos. Otra utilidad más de Gmail que está ahí y si no te fijas la estás usando sin saberlo y que además sirve para usarla como un reconocedor OCR. Algo parecido a la opción de convertir formatos de documentos o ver sólo su texto. Es un link a mi página, así que si consideráis que no debe estar símplemente borradla o no la votéis. Pongo el link porque no he encontrado información sobre esto en ningún otro sitio, y por tanto creo que soy la fuente directa. Espero no moleste

6meneos

Google indexa con tecnología OCR contenidos de documentos PDF de textos escaneados

La mayoría de los documentos con textos en formato PDF que hay en la WWW son generados a partir editores de texto, por lo cual, el propio robot de Google, puede extraer de manera muy fácil los contenidos. Pero un porcentaje de estos ficheros PDF son imágenes escaneadas de otros documentos, con lo que ya no podemos extraer el texto con nuestro lector PDF. Pero ahora, el robot de Google, gracias a su tecnología OCR propia, ya es capaz de convertir estas imágenes en textos.

1: Dupe: http://meneame.net/story/google-indexa-texto-documentos-escaneados
13meneos

OCR usando software "gal"

Reseña de un software de reconocimiento de texto open source bastante bueno, con mucho potencial para explotar.

112meneos

Tutorial: reconocimiento de texto en Ubuntu 7.04 con el OCR liberado por Google (Tesseract)

Tutorial (en inglés) para el reconocimiento de texto con Tesseract OCR en Ubuntu 7.04, pero sirve para cualquier sistema (GNU/)Linux con imagemagick. Se trata de un programa desarrollado por HP durante 10 años, mejorado y liberado por Google (asegura que es el mejor OCR libre). Ya vimos que Google presentó el proyecto hace un año: meneame.net/story/google-hace-open-source-soft-ocr y ya lo está integrando en una suite más potente que incluye reconocimiento de escritura manual multilingüe: meneame.net/story/ocr-open-source-de-google

209meneos

OCR Open Source de Google

Google va a patrocinar el desarrollo de un OCR Open Source. El proyecto tiene como objetivos avanzar en el reconocimiento óptico de caracteres y tecnologías relacionadas para ofrecer un sistema OCR de alta calidad que permita usarlo para la conversión de documentos, para crear librerías electrónicas, ofrecer un mejor soporte para disminuidos ópticos, en análisis de documentos históricos y para el uso de escritorio en general.

1meneos

reCAPTCHA - combatir el spam y digitalizar libros

Todos sabemos lo que es y para que sirve un "captcha". Bien, reCAPTCHA utiliza imágenes de libros digitalizados que los OCR no son capaces de reconocer de forma automática. Así, además de evitar el spam conseguimos ampliar la cantidad de información digital disponible. Ganamos todos.

 1 comentarios en: cultura, literatura karma: -31
15meneos

Descifra los captcha automaticamente o cualquier texto en alguna imagen

GNU Ocrad es un programa de OCR (Reconocimiento de Caracteres Ópticos) basado en un método de extracción de características (feature extraction). Ocrad lee una imagen en formato pbm (mapa de bits), pgm (escala de grises) o ppm (color), y produce texto en formato byte (8-bit) o UTF-8. También incluye un analizador de composición (layout) capaz de separar las columnas o bloques de texto que forman normalmente las páginas impresas. Ocrad puede ser usado como aplicación autónoma en modo texto, o como complemento (backend) de otros programas.

13meneos

ReCaptcha una ayuda manual a los OCR

Una interesante aplicación de los captchas que permite colaborar en los proyectos de digitalización de los textos de archive.org. Esta utilidad emplea el factor humano para corregir las imperfecciones del actual software de reconocimiento de carácteres a la vez que nos protege del spam en las entradas de nuestras webs.

4meneos

Sicubo lanza un nuevo software de gestión documental que promete grandes prestaciones

Qatris Icatalog es un software completo de gestión documental pensado para optimizar la labor de digitalizar y organizar automáticamente los documentos en papel que se producen en la labor diaria de la empresa. Qatris Icatalog ofrece una herramienta profesional para la digitalización y automatización en base a un avanzado y eficiente proceso de clasificación automática de documentos de manera que el usuario solo tenga que introducir los documentos en el escáner y Qatris se ocupe de todo lo demás.

34meneos

Demostración de texto a voz (TTS) de Loquendo

Demostración de un avanzado sistema de texto a voz (Text-to-speech,TTS) de Loquendo (para integrar en GPS, por ejemplo). Puede decir cualquier frase en varios idiomas y sexos, y permite descargarse lo que dice el intérprete. También vale para generar sonitonos personalizados gratis ;)

7meneos

Google indexa el texto de los documentos escaneados!!!

Google acaba de hacer público, que a partir de ahora, y gracias a la tecnología de OCR, será capaz de leer el contenido/texto de aquellos documentos escaneados que contuviesen contenido. Esto sin lugar a duda, supone una gran evolución y mejora para todas aquellas empresas que basan su histórico de noticias de documentos de prensa escaneados, que a partir de ahora podrán mejorar el posicionamiento de sus webs.

2: #1 Es increíble que alguien se cree varias cuentas y encima comente en las noticias que envían sus clones... :roll:
17meneos

Servidor de Ocr [ENG]

Convierte imágenes escaneadas en Texto. Es un servicio en el que subes imágenes y recuperas el texto que hay en ellas, usando OCR.

20meneos

google ocropus

ocropus OCR project es el nombre de un nuevo e interesante proyecto de Google, que está siendo desarrollado bajo licencia Open Source. google promete un proyecto destinado a desarrollar un software OCR (optical character recognition), reconocimiento óptico de caracteres que será publicado bajo licencia Apache 2.0.

36meneos

Programador español publica bot de IA de código abierto que aprende a jugar a Geochallenge vídeo

C&P: Este bot utiliza técnicas de visión por computador, reconocimiento de caracteres (OCR) y aprendizaje por refuerzo para aprender a jugar a Geochallenge (uno de los juegos flash de Facebook) de forma totalmente autónoma. Este programa desarrollado en C++ estándar es OpenSource (GPL3) y por supuesto puede descargarse gratuitamente. Hasta ahora, solo existían programas similares de pago.

293meneos

Un ingenio para el escaneo automático y masivo de libros encuadernados vídeo

El Treventus Buchscanner ScanRobot es un curioso ingenio alemán que escanea libros encuadernados, en alta resolución, a la velocidad de 2.500 páginas por hora – el sueño de cualquier bibliotecario. Utiliza un mecanismo robótico y chorros de aire (según parece verse en el vídeo). En cada pasada escanea dos caras de la hoja a la vez, y luego se añaden funciones de OCR y otras sutilezas. Una persona puede escanear libros a mano a un ritmo de entre 5 y 8 páginas por minuto; este ingenio alcanza las 25 páginas por minuto.

« anterior12» siguiente

menéame