juank1971
27-08-2013, 22:50:51
Hola amigos:
Estoy haciendo una aplicacion como una especie de saco que grava casi todo lo que necesito de electrónica generalmente son Datasheet que son PDF, la mayoría, y algunos ficheros de otro tipo, el final es todo metido a una base de sqlite3, todo funciona bien, los guardo en un campo blob.
Los tengo organizados y todo funciona bien , los saco o cosulto cuando quiero y todo organizado por categoría, Ahora bien:
A la hora de hacer busquedas se me ocurrio antes de entrar los pdf a la base de datos sqlite, los convierto a texto, y guardo el texto en un campo entonces las busquedas se hacen en sqlite rapido y puedes hacer una busqueda de todos los miles de pdf dentro de cada documento, algo que en windows no se puede hacer rapido , buscar dentro de pdf.
Pero el problema lo tengo en la forma que hago es en un programa sugerido por ustedes en otro hilo esta linea de comandos msdos:
pdftotext -raw biblia delphi.pdf prueba.txt
con eso optengo un texto con lo que necesito y luego lo guardo a la base de datos, tienen alguna idea de como puedo hacer eso y saber con un progress un aproximado del tiempo para que el usuario no tenga que esperar sin ver nada en ese indexado previo a guardar el archivo pdf???
gracias juank
Estoy haciendo una aplicacion como una especie de saco que grava casi todo lo que necesito de electrónica generalmente son Datasheet que son PDF, la mayoría, y algunos ficheros de otro tipo, el final es todo metido a una base de sqlite3, todo funciona bien, los guardo en un campo blob.
Los tengo organizados y todo funciona bien , los saco o cosulto cuando quiero y todo organizado por categoría, Ahora bien:
A la hora de hacer busquedas se me ocurrio antes de entrar los pdf a la base de datos sqlite, los convierto a texto, y guardo el texto en un campo entonces las busquedas se hacen en sqlite rapido y puedes hacer una busqueda de todos los miles de pdf dentro de cada documento, algo que en windows no se puede hacer rapido , buscar dentro de pdf.
Pero el problema lo tengo en la forma que hago es en un programa sugerido por ustedes en otro hilo esta linea de comandos msdos:
pdftotext -raw biblia delphi.pdf prueba.txt
con eso optengo un texto con lo que necesito y luego lo guardo a la base de datos, tienen alguna idea de como puedo hacer eso y saber con un progress un aproximado del tiempo para que el usuario no tenga que esperar sin ver nada en ese indexado previo a guardar el archivo pdf???
gracias juank