Club Delphi  
    FTP   CCD     Buscar   Trucos   Trabajo   Foros

Retroceder   Foros Club Delphi > Principal > FireMonkey
Registrarse FAQ Miembros Calendario Guía de estilo Temas de Hoy

Respuesta
 
Herramientas Buscar en Tema Desplegado
  #1  
Antiguo 19-12-2019
terb terb is offline
Registrado
 
Registrado: may 2006
Posts: 4
Poder: 0
terb Va por buen camino
Leer de un archivo pdf en Android para extraer una información concreta

Hola a todos,

¿Alguien sabe como leer de un archivo PDF en Android para extraer una información concreta o exportarla a otro formato (texto , rtf, word...) para así poderlo leer?

Gracias.
Responder Con Cita
  #2  
Antiguo 19-12-2019
Avatar de Neftali [Germán.Estévez]
Neftali [Germán.Estévez] Neftali [Germán.Estévez] is offline
[becario]
 
Registrado: jul 2004
Ubicación: Barcelona - España
Posts: 18.275
Poder: 10
Neftali [Germán.Estévez] Es un diamante en brutoNeftali [Germán.Estévez] Es un diamante en brutoNeftali [Germán.Estévez] Es un diamante en bruto
Que yo sepra, con las librerías estandard de Delphi no se puede.
Deberás buscar librerías externas para poder hacerlo.
__________________
Germán Estévez => Web/Blog
Guía de estilo, Guía alternativa
Utiliza TAG's en tus mensajes.
Contactar con el Clubdelphi

P.D: Más tiempo dedicado a la pregunta=Mejores respuestas.
Responder Con Cita
  #3  
Antiguo 19-12-2019
Avatar de TiammatMX
TiammatMX TiammatMX is offline
Miembro
 
Registrado: jun 2006
Ubicación: Universo Curvo\Vía Láctea\Sistema Solar\Planeta Tierra\América\México\Puebla\Heróica Puebla de Zaragoza\Jardines de San Manuel\Home
Posts: 746
Poder: 18
TiammatMX Va camino a la fama
Cita:
Empezado por terb Ver Mensaje
...para así poderlo leer?...
Explica, ¿no se puede leer el PDF? ¿Convertirlo a otro formato PARA LEERLO? Entonces, ¿en dónde queda el carácter UNIVERSAL Y ESTANDARIZADO del formato PDF?

O ya estoy de plano muy anticuado con mis conceptos.
__________________
Felipe Eduardo Ortiz López. Delphi programmers does it recursively...

"Un programador, es un creador de universos en donde sólo él es responsable. Universos de complejidad prácticamente ilimitada que se puede crear en forma de programas de ordenador." - Joseph Weizenbaum.

Témele a los profetas... y a aquellos que están listos para morir por "la verdad", ya que como regla general hacen morir a muchos otros con ellos, frecuentemente antes que ellos, y a veces en lugar de ellos. — Umberto Eco
Responder Con Cita
  #4  
Antiguo 20-12-2019
Javierus Javierus is offline
Miembro
 
Registrado: jun 2017
Posts: 88
Poder: 7
Javierus Va por buen camino
Es universal, porque puede representar cualquier documento "impreso". Y estandarizado porque lo está.
Pero no está orientado a la distribución de información sino de documentos fieles al impreso, por lo que dos textos como por ejemplo "factura Nº" y a su lado "123456", que están evidentemente relacionados semánticamente, en el formato no tienen por qué estar relacionados: solo es importante que al visualizarlo se muestren como está previsto.

Hay herramientas que te extraen el texto con cierta similitud estructural a cómo aparece en pantalla, es decir, si dos cosas se muestran consecutivas, pues en el texto son consecutivas. Pero no siempre: depende de cómo se haya creado el PDF; quizás el texto a la derecha esté unos píxeles más arriba o abajo, y esto resulte en que la conversión a texto lo deje en líneas diferentes.

Igual que una página HTML puede presentar una información, pero internamente tener una estructura semánticamente muy distinta del aspecto que se muestre en pantalla, que dependerá también de CSS, etc etc

Incluso XML, que no tiene absolutamente nada que ver con los otros, porque es un sistema de información estructurada, necesita de herramientas (librerías) adecuadas para manejarlo eficientemente. Aunque te las hagas tú.

/fin del rollo
Responder Con Cita
  #5  
Antiguo 20-12-2019
Avatar de Neftali [Germán.Estévez]
Neftali [Germán.Estévez] Neftali [Germán.Estévez] is offline
[becario]
 
Registrado: jul 2004
Ubicación: Barcelona - España
Posts: 18.275
Poder: 10
Neftali [Germán.Estévez] Es un diamante en brutoNeftali [Germán.Estévez] Es un diamante en brutoNeftali [Germán.Estévez] Es un diamante en bruto
Se me ocurre que hay servidores Online que te permiten hacerlo.
No se si puedes encontrar alguno que se ajuste a lo que necesitas. De esta forma tal vez no dependas de componentes.
__________________
Germán Estévez => Web/Blog
Guía de estilo, Guía alternativa
Utiliza TAG's en tus mensajes.
Contactar con el Clubdelphi

P.D: Más tiempo dedicado a la pregunta=Mejores respuestas.
Responder Con Cita
  #6  
Antiguo 26-12-2019
terb terb is offline
Registrado
 
Registrado: may 2006
Posts: 4
Poder: 0
terb Va por buen camino
Primero de todo gracias por contestar.

He probado los componentes de Gnostice concretamente el ejemplo que instala en C:\Users\XXX\Documents\Gnostice\Document Studio Delphi\Demos\Delphi\FMX\1. Document Viewer
Y lo he modificado para usar el TgtDocumentConverter y convertir un Pdf a texto pero no se por qué no funciona / no crea ningún archivo .txt y tampoco da ninguna excepción:

Código:
procedure TForm1.lbFilesChange(Sender: TObject);
var
sFileName:string;
DateTimeNow: TDateTime;
DateTimeFile:string;
sPath:string;
sGetDownloadsPath:string;
sException:string;
begin
  try
    try
      lbFiles.Visible := False;
      // Enable buttons back for Mobile
      ActionFileLoad.Enabled := True;

      //Add
      FFileName := FDocDir + PathDelim + lbFiles.Items[lbFiles.ItemIndex];
      DateTimeNow :=  Now;
      DateTimeFile := FormatDateTime('dd_mm_yy_hh_nn_ss',DateTimeNow);
      sFileName := 'demo'+DateTimeFile+'.txt';
      gtDocumentConverter1.InputDocuments.AddDocument(FFileName,'');
      sGetDownloadsPath := TPath.Combine(TPath.GetDownloadsPath,'');
      gtDocumentConverter1.ConvertToFile('.txt',True,True,sGetDownloadsPath, sFileName);
      ShowMessage('Conversion completed');
      //End Add
      DocViewer.LoadFromFile(FFileName);
    except on E: Exception do
      sException:=E.Message;
    end;
  finally
  end;
end;
He visto la funcionalidad de esta clase esta en VCL pero no la veo para FMX. En este link:
gnostice.com/docs/xtremedocumentstudio_delphi/frames.html?frmname=topic&frmfile=vcl_gtxDocumentConverter_TgtDocumentConverter.html

Entonces…
Me surge otra duda … es posible ejecutar un programa java de consola desde Delphi?
Porque la funcionalidad de extraer texto de un Pdf creo recordar que era posible hacerla en Java.

Buenas fiestas y gracias.
Responder Con Cita
Respuesta



Normas de Publicación
no Puedes crear nuevos temas
no Puedes responder a temas
no Puedes adjuntar archivos
no Puedes editar tus mensajes

El código vB está habilitado
Las caritas están habilitado
Código [IMG] está habilitado
Código HTML está deshabilitado
Saltar a Foro

Temas Similares
Tema Autor Foro Respuestas Último mensaje
¿Qué información debo leer para saber de Facturación Electrónica? Carmelo Cash Varios 5 08-04-2015 11:08:47
Leer informacion en nodos de diferentes niveles de un archivo XML cmfab Varios 2 24-10-2012 15:51:35
extraer informacion de un archivo .txt richy08 PHP 8 16-10-2010 06:17:32
Leer un fichero PDF para grabar información en una Base de Datos ALMERA Impresión 0 06-03-2009 14:13:54
Leer archivo de texto y extraer lineas de el mp3968 API de Windows 1 19-05-2007 20:27:53


La franja horaria es GMT +2. Ahora son las 15:58:22.


Powered by vBulletin® Version 3.6.8
Copyright ©2000 - 2024, Jelsoft Enterprises Ltd.
Traducción al castellano por el equipo de moderadores del Club Delphi
Copyright 1996-2007 Club Delphi