PDA

Ver la Versión Completa : Extraer texto de pdf


trex2000
18-05-2021, 06:09:33
Saludos a todos.

¿Cómo podría leer un archivo PDF para ir extrayendo ciertos datos basado en ciertos criterios que están en el documento, ya que tiene demasiadas paginas?

Ejemplo:
En el titulo de la pagina va la sucursal y en caso de que sea la sucursal que esta procesando que lea los datos que se necesitan hasta que cambie el titulo, si no corresponde el titulo que se brinque a la siguiente pagina.

Espero haberme explicado bien.

De antemano muchas gracias.

Neftali [Germán.Estévez]
18-05-2021, 11:55:05
Te recomiendo que realices una búsqueda en los foros.
Por ejemplo, aquí ya hemos hablado del tema y es posible que encuentres algun hilo más.
https://www.clubdelphi.com/foros/showthread.php?t=94348

Es posible que utilizando el ActiveX de Adobe también puedas conseguirlo, pero eso implica que debas tenerlo instalado, cosa que no es segura, porque puedes tener otros lectores en el sistema.

También se que hay herramientas gratuitas que puedes conseguir y llamarlas como ejecutables con parámetros.
https://en.wikipedia.org/wiki/Pdftotext
https://mupdf.com/

Seguro que también puedes utilizar alguna solución online que te lo resuelva, pero eso implica otros problemas y dependencias.

CFPA86
17-06-2021, 01:52:20
Hola Trex2000, si leyendo lo que el compañero Neftali te respondio y aun persiste el inconveniente, te recomiendo visitar este sitio https://www.swissdelphicenter.com/en/showcode.php, en el encontraras un codigo que a ti te puede funcionar muy a pesar que a mi no me funciono xq creo yo, no reconoce el control Acrobat_TLB. En caso que te corra dicho codigo me lo haces saber (cfpa86@hotmail.com) te estaria agradecido, puesto que tengo el mismo inconveniente.
Espero haberte colaborado sin animo de opacar a Neftali que es un teso en nuestro Delhi