Club Delphi  
    FTP   CCD     Buscar   Trucos   Trabajo   Foros

Retroceder   Foros Club Delphi > Principal > Varios
Registrarse FAQ Miembros Calendario Guía de estilo Temas de Hoy

Grupo de Teaming del ClubDelphi

Respuesta
 
Herramientas Buscar en Tema Desplegado
  #1  
Antiguo 01-09-2012
Avatar de dec
dec dec is offline
Moderador
 
Registrado: dic 2004
Ubicación: Alcobendas, Madrid, España
Posts: 13.107
Poder: 34
dec Tiene un aura espectaculardec Tiene un aura espectacular
Tesseract OCR (Optical Character Recognition) desde Delphi

Hola a todos,

No sé si conocéis el proyecto Tesseract OCR (Optical Character Recognition). Si es así, probablemente, sabéis que no parece sencillo encontrar una forma de trabajar con Tesseract desde Delphi, aparte de cierto componente de WinSoft. Pues bien, es el caso que, por razones que no vienen al caso, he dado unas cuentas vueltas a este asunto, hasta que, por fin, he llevado a cabo una clase para Delphi que permite utilizar Tesseract OCR.

No existen DLL's de Tesseract desde la versión 2.0. Hasta donde yo llego, sólo es posible conseguir un archivo ejecutable que funciona a través de la línea de comandos. Ahora bien, he pensado que podría utilizar este ejecutable, pero, de la forma más transparente posible. Hacer esto, aunque acaso no muy elegante, aporta alguna ventaja, como, en principio, poder utilizar siempre la última versión de Tesseract. Además el asunto parece funcionar razonablemente bien, y, yo no pretendo esconder de ninguna manera este "diseño", pues lo considero hasta "legítimo".

Pues bien, el caso es que he conseguido mi objetivo, aunque, centrándome en el proyecto en que tenía pensado incorporar la clase de que hablo. ¿Qué quiere esto decir? Está documentado en la propia clase, pero, básicamente, significa que el proceso de Tesseract es ejecutado de forma secuencial, esto es, no he sido capaz de utilizar hilos, aunque lo he hecho así al principio, lo cierto es que el proyecto al que la clase va destinada es un poco tiquismiquis: se trata de una DLL que se ejecuta en un programa "host", y, esto causa algunas veces (como en este caso) problemas raros, incomprensibles y de complicada depuración.

Sin embargo, aunque el proceso de Tesseract no se ejecuta en su propio hilo, sí que se hace de forma que la aplicación "responda" al usuario, y, de hecho, la clase permite cancelar la tarea que estemos llevando a cabo. En fin, no me quiero enrrollar más, simplemente, me ha apetecido compartir esto con vosotros. En el archivo que a continuación enlazaré podréis encontrar la clase "TTesseract" (con comentarios en mi pobre inglés), así como todos los archivos necesarios y el código fuente de un ejemplo de uso, así como su correspondiente archivo binario.

Cualquier comentario o sugerencia será bienvenida. Para descargar "TTesseract", por favor, sigue este enlace. Huelga decir que, si lo estimáis oportuno, podéis hacer uso de esta clase de la forma en que queráis, aunque, bajo la licencia Apache 2.0, la misma en que está licenciado Tesseract ORC.

Última edición por dec fecha: 01-09-2012 a las 20:34:48.
Responder Con Cita
  #2  
Antiguo 01-09-2012
Avatar de Casimiro Notevi
Casimiro Notevi Casimiro Notevi is offline
Moderador
 
Registrado: sep 2004
Ubicación: En algún lugar.
Posts: 32.042
Poder: 10
Casimiro Notevi Tiene un aura espectacularCasimiro Notevi Tiene un aura espectacular
Gracias
Responder Con Cita
  #3  
Antiguo 01-09-2012
Avatar de dec
dec dec is offline
Moderador
 
Registrado: dic 2004
Ubicación: Alcobendas, Madrid, España
Posts: 13.107
Poder: 34
dec Tiene un aura espectaculardec Tiene un aura espectacular
Cita:
Empezado por Casimiro Notevi Ver Mensaje
Gracias
¡De nada Casimiro!
Responder Con Cita
  #4  
Antiguo 01-09-2012
Avatar de roman
roman roman is offline
Moderador
 
Registrado: may 2003
Ubicación: Ciudad de México
Posts: 20.269
Poder: 10
roman Es un diamante en brutoroman Es un diamante en brutoroman Es un diamante en bruto
Pues sí. Gracias Aunque todavía no entiendo bien de qué va la cosa. O creo que no entendí tu explicación . Probé el sample pero supongo que está para inglés pues no reconoce acentos.

Sugerencia para el sample: que el resultado lo ponga en un memo y así veamos que no es otra imagen la que estás poniendo

// Saludos
Responder Con Cita
  #5  
Antiguo 01-09-2012
Avatar de dec
dec dec is offline
Moderador
 
Registrado: dic 2004
Ubicación: Alcobendas, Madrid, España
Posts: 13.107
Poder: 34
dec Tiene un aura espectaculardec Tiene un aura espectacular
Hola,

Gracias a ti Román. A ver, vamos por partes, como dijo Jack el destripador.

Para usar el lenguaje español (a ver si te reconoce algún acento) usa algo así:

Código Delphi [-]
      FTesseract.RunTesseract
      (
        FileName,
        tpsmFullyAutomaticWithNoOSD,
        'spa', // Indicamos el lenguaje español, tal vez hagamos constantes de esto...
        '.\tesseract-config'
      );

Respecto del ejemplo, sí, supongo que pueden hacerse algunas mejoras, gracias por la sugerencia de usar un "TMemo".
Responder Con Cita
  #6  
Antiguo 01-09-2012
Avatar de dec
dec dec is offline
Moderador
 
Registrado: dic 2004
Ubicación: Alcobendas, Madrid, España
Posts: 13.107
Poder: 34
dec Tiene un aura espectaculardec Tiene un aura espectacular
Hola,

Sólo para decir que he actualizado el ejemplo un tanto y creo que ahora te gustará un poco más Román.
Responder Con Cita
  #7  
Antiguo 03-09-2012
Avatar de duilioisola
[duilioisola] duilioisola is offline
Miembro Premium
 
Registrado: ago 2007
Ubicación: Barcelona, España
Posts: 1.734
Poder: 20
duilioisola Es un diamante en brutoduilioisola Es un diamante en brutoduilioisola Es un diamante en bruto
Que bien dec!!!
Ahora mismo estoy trabajando en un proyecto para escanear documentos y estoy utilizando el componente de Winsoft que mencionas en pruebas.
Ya mismo descargaré tu componente y lo miraré.

Muchas gracias
Responder Con Cita
  #8  
Antiguo 03-09-2012
Avatar de duilioisola
[duilioisola] duilioisola is offline
Miembro Premium
 
Registrado: ago 2007
Ubicación: Barcelona, España
Posts: 1.734
Poder: 20
duilioisola Es un diamante en brutoduilioisola Es un diamante en brutoduilioisola Es un diamante en bruto
Después de pelearme un rato con los directorios he hecho estas modificaciones en el componente para que trabaje con rutas absolutas.
Todavía no entiendo porqué, pero supongo que al ejecutarse mediante CreateProcess, debe tomar como ruta la del usuario %USERPROFILE%=C:\Document and Settings\NombreUsuario\

Código Delphi [-]
constructor TTesseract.Create( tesseractDllPath, tessDataDirPath : string );
begin
  inherited Create();
  FCancelTask := false;
  FTaskIsRunning := false;
  FTemporalFilePath := GetTemporalFilePath();
  // We assert the needed file and dir later, not here
  FTesseractDllPath := ExpandUNCFileName(tesseractDllPath);
  FTesseractDataDirPath := IncludeTrailingPathDelimiter( ExpandUNCFileName(tessDataDirPath) );
end;
Responder Con Cita
  #9  
Antiguo 03-09-2012
Avatar de dec
dec dec is offline
Moderador
 
Registrado: dic 2004
Ubicación: Alcobendas, Madrid, España
Posts: 13.107
Poder: 34
dec Tiene un aura espectaculardec Tiene un aura espectacular
Hola,

Gracias por tus comentarios duilioisola. En realidad el asunto de las rutas relativas/absolutas no tiene que ver con el componente. Verás, no sé porqué, en el ejemplo me dio por utilizar rutas relativas. Es una tontería, porque, uno puede averiguar dónde está el ejecutable del ejemplo y conformar rutas absolutas a partir de ahí. Pero, fuera de eso, las rutas relativas/absolutas, hasta donde yo llego, no entran en el funcionamiento del componente. He podido probar el asunto en Windows 7 y 8, y, me consta que también funciona bien en Windows XP.

Gracias de nuevo por tus comentarios, y, ojalá mis humildes esfuerzos puedan ser de utilidad para ti.
Responder Con Cita
  #10  
Antiguo 03-09-2012
Avatar de dec
dec dec is offline
Moderador
 
Registrado: dic 2004
Ubicación: Alcobendas, Madrid, España
Posts: 13.107
Poder: 34
dec Tiene un aura espectaculardec Tiene un aura espectacular
Hola,

Se me olvidó comentar, para quien esté interesado, que, he hecho algunos cambios.

No demasiado importantes, pero, en fin, lo digo por si queréis descargarlo de nuevo.
Responder Con Cita
  #11  
Antiguo 14-11-2014
Avatar de pacopenin
pacopenin pacopenin is offline
Miembro
 
Registrado: sep 2010
Ubicación: Asturias
Posts: 382
Poder: 14
pacopenin Va por buen camino
Estoy muy interesado en probarlo pero el enlace no descarga nada, lleva a la página de NeoPlugins. Dec, hay alguna posibilidad que se reponga?

Garcias.
__________________
http://www.gestionportable.com
Responder Con Cita
Respuesta



Normas de Publicación
no Puedes crear nuevos temas
no Puedes responder a temas
no Puedes adjuntar archivos
no Puedes editar tus mensajes

El código vB está habilitado
Las caritas están habilitado
Código [IMG] está habilitado
Código HTML está deshabilitado
Saltar a Foro

Temas Similares
Tema Autor Foro Respuestas Último mensaje
CHARACTER SET ISO8859_1 is not defined erickperez6 Firebird e Interbase 10 07-02-2013 16:05:05
Problemas con Character Set Thorbillisner MySQL 0 16-11-2010 15:45:30
Character set no se encuentra JosepGA Conexión con bases de datos 3 10-09-2008 14:41:20
'default Character Set Iso8859_1' Io Firebird e Interbase 3 07-09-2005 17:46:19
error de character set ibuser Varios 2 15-07-2004 17:21:02


La franja horaria es GMT +2. Ahora son las 04:04:30.


Powered by vBulletin® Version 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Traducción al castellano por el equipo de moderadores del Club Delphi
Copyright 1996-2007 Club Delphi