FTP | CCD | Buscar | Trucos | Trabajo | Foros |
|
Registrarse | FAQ | Miembros | Calendario | Guía de estilo | Temas de Hoy |
|
Herramientas | Buscar en Tema | Desplegado |
|
#1
|
||||
|
||||
Tesseract OCR (Optical Character Recognition) desde Delphi
Hola a todos,
No sé si conocéis el proyecto Tesseract OCR (Optical Character Recognition). Si es así, probablemente, sabéis que no parece sencillo encontrar una forma de trabajar con Tesseract desde Delphi, aparte de cierto componente de WinSoft. Pues bien, es el caso que, por razones que no vienen al caso, he dado unas cuentas vueltas a este asunto, hasta que, por fin, he llevado a cabo una clase para Delphi que permite utilizar Tesseract OCR. No existen DLL's de Tesseract desde la versión 2.0. Hasta donde yo llego, sólo es posible conseguir un archivo ejecutable que funciona a través de la línea de comandos. Ahora bien, he pensado que podría utilizar este ejecutable, pero, de la forma más transparente posible. Hacer esto, aunque acaso no muy elegante, aporta alguna ventaja, como, en principio, poder utilizar siempre la última versión de Tesseract. Además el asunto parece funcionar razonablemente bien, y, yo no pretendo esconder de ninguna manera este "diseño", pues lo considero hasta "legítimo". Pues bien, el caso es que he conseguido mi objetivo, aunque, centrándome en el proyecto en que tenía pensado incorporar la clase de que hablo. ¿Qué quiere esto decir? Está documentado en la propia clase, pero, básicamente, significa que el proceso de Tesseract es ejecutado de forma secuencial, esto es, no he sido capaz de utilizar hilos, aunque lo he hecho así al principio, lo cierto es que el proyecto al que la clase va destinada es un poco tiquismiquis: se trata de una DLL que se ejecuta en un programa "host", y, esto causa algunas veces (como en este caso) problemas raros, incomprensibles y de complicada depuración. Sin embargo, aunque el proceso de Tesseract no se ejecuta en su propio hilo, sí que se hace de forma que la aplicación "responda" al usuario, y, de hecho, la clase permite cancelar la tarea que estemos llevando a cabo. En fin, no me quiero enrrollar más, simplemente, me ha apetecido compartir esto con vosotros. En el archivo que a continuación enlazaré podréis encontrar la clase "TTesseract" (con comentarios en mi pobre inglés), así como todos los archivos necesarios y el código fuente de un ejemplo de uso, así como su correspondiente archivo binario. Cualquier comentario o sugerencia será bienvenida. Para descargar "TTesseract", por favor, sigue este enlace. Huelga decir que, si lo estimáis oportuno, podéis hacer uso de esta clase de la forma en que queráis, aunque, bajo la licencia Apache 2.0, la misma en que está licenciado Tesseract ORC. Última edición por dec fecha: 01-09-2012 a las 20:34:48. |
#2
|
||||
|
||||
Gracias
|
#3
|
||||
|
||||
#4
|
||||
|
||||
Pues sí. Gracias Aunque todavía no entiendo bien de qué va la cosa. O creo que no entendí tu explicación . Probé el sample pero supongo que está para inglés pues no reconoce acentos.
Sugerencia para el sample: que el resultado lo ponga en un memo y así veamos que no es otra imagen la que estás poniendo // Saludos |
#5
|
||||
|
||||
Hola,
Gracias a ti Román. A ver, vamos por partes, como dijo Jack el destripador. Para usar el lenguaje español (a ver si te reconoce algún acento) usa algo así:
Respecto del ejemplo, sí, supongo que pueden hacerse algunas mejoras, gracias por la sugerencia de usar un "TMemo". |
#6
|
||||
|
||||
Hola,
Sólo para decir que he actualizado el ejemplo un tanto y creo que ahora te gustará un poco más Román. |
#7
|
||||
|
||||
Que bien dec!!!
Ahora mismo estoy trabajando en un proyecto para escanear documentos y estoy utilizando el componente de Winsoft que mencionas en pruebas. Ya mismo descargaré tu componente y lo miraré. Muchas gracias |
#8
|
||||
|
||||
Después de pelearme un rato con los directorios he hecho estas modificaciones en el componente para que trabaje con rutas absolutas.
Todavía no entiendo porqué, pero supongo que al ejecutarse mediante CreateProcess, debe tomar como ruta la del usuario %USERPROFILE%=C:\Document and Settings\NombreUsuario\
|
#9
|
||||
|
||||
Hola,
Gracias por tus comentarios duilioisola. En realidad el asunto de las rutas relativas/absolutas no tiene que ver con el componente. Verás, no sé porqué, en el ejemplo me dio por utilizar rutas relativas. Es una tontería, porque, uno puede averiguar dónde está el ejecutable del ejemplo y conformar rutas absolutas a partir de ahí. Pero, fuera de eso, las rutas relativas/absolutas, hasta donde yo llego, no entran en el funcionamiento del componente. He podido probar el asunto en Windows 7 y 8, y, me consta que también funciona bien en Windows XP. Gracias de nuevo por tus comentarios, y, ojalá mis humildes esfuerzos puedan ser de utilidad para ti. |
#10
|
||||
|
||||
Hola,
Se me olvidó comentar, para quien esté interesado, que, he hecho algunos cambios. No demasiado importantes, pero, en fin, lo digo por si queréis descargarlo de nuevo. |
#11
|
||||
|
||||
Estoy muy interesado en probarlo pero el enlace no descarga nada, lleva a la página de NeoPlugins. Dec, hay alguna posibilidad que se reponga?
Garcias.
__________________
http://www.gestionportable.com |
|
|
Temas Similares | ||||
Tema | Autor | Foro | Respuestas | Último mensaje |
CHARACTER SET ISO8859_1 is not defined | erickperez6 | Firebird e Interbase | 10 | 07-02-2013 16:05:05 |
Problemas con Character Set | Thorbillisner | MySQL | 0 | 16-11-2010 15:45:30 |
Character set no se encuentra | JosepGA | Conexión con bases de datos | 3 | 10-09-2008 14:41:20 |
'default Character Set Iso8859_1' | Io | Firebird e Interbase | 3 | 07-09-2005 17:46:19 |
error de character set | ibuser | Varios | 2 | 15-07-2004 17:21:02 |
|