FTP | CCD | Buscar | Trucos | Trabajo | Foros |
|
Registrarse | FAQ | Miembros | Calendario | Guía de estilo | Buscar | Temas de Hoy | Marcar Foros Como Leídos |
|
Herramientas | Buscar en Tema | Desplegado |
|
#1
|
|||
|
|||
Es universal, porque puede representar cualquier documento "impreso". Y estandarizado porque lo está.
Pero no está orientado a la distribución de información sino de documentos fieles al impreso, por lo que dos textos como por ejemplo "factura Nº" y a su lado "123456", que están evidentemente relacionados semánticamente, en el formato no tienen por qué estar relacionados: solo es importante que al visualizarlo se muestren como está previsto. Hay herramientas que te extraen el texto con cierta similitud estructural a cómo aparece en pantalla, es decir, si dos cosas se muestran consecutivas, pues en el texto son consecutivas. Pero no siempre: depende de cómo se haya creado el PDF; quizás el texto a la derecha esté unos píxeles más arriba o abajo, y esto resulte en que la conversión a texto lo deje en líneas diferentes. Igual que una página HTML puede presentar una información, pero internamente tener una estructura semánticamente muy distinta del aspecto que se muestre en pantalla, que dependerá también de CSS, etc etc Incluso XML, que no tiene absolutamente nada que ver con los otros, porque es un sistema de información estructurada, necesita de herramientas (librerías) adecuadas para manejarlo eficientemente. Aunque te las hagas tú. /fin del rollo |
#2
|
||||
|
||||
Se me ocurre que hay servidores Online que te permiten hacerlo.
No se si puedes encontrar alguno que se ajuste a lo que necesitas. De esta forma tal vez no dependas de componentes.
__________________
Germán Estévez => Web/Blog Guía de estilo, Guía alternativa Utiliza TAG's en tus mensajes. Contactar con el Clubdelphi P.D: Más tiempo dedicado a la pregunta=Mejores respuestas. |
#3
|
|||
|
|||
Primero de todo gracias por contestar.
He probado los componentes de Gnostice concretamente el ejemplo que instala en C:\Users\XXX\Documents\Gnostice\Document Studio Delphi\Demos\Delphi\FMX\1. Document Viewer Y lo he modificado para usar el TgtDocumentConverter y convertir un Pdf a texto pero no se por qué no funciona / no crea ningún archivo .txt y tampoco da ninguna excepción: Código:
procedure TForm1.lbFilesChange(Sender: TObject); var sFileName:string; DateTimeNow: TDateTime; DateTimeFile:string; sPath:string; sGetDownloadsPath:string; sException:string; begin try try lbFiles.Visible := False; // Enable buttons back for Mobile ActionFileLoad.Enabled := True; //Add FFileName := FDocDir + PathDelim + lbFiles.Items[lbFiles.ItemIndex]; DateTimeNow := Now; DateTimeFile := FormatDateTime('dd_mm_yy_hh_nn_ss',DateTimeNow); sFileName := 'demo'+DateTimeFile+'.txt'; gtDocumentConverter1.InputDocuments.AddDocument(FFileName,''); sGetDownloadsPath := TPath.Combine(TPath.GetDownloadsPath,''); gtDocumentConverter1.ConvertToFile('.txt',True,True,sGetDownloadsPath, sFileName); ShowMessage('Conversion completed'); //End Add DocViewer.LoadFromFile(FFileName); except on E: Exception do sException:=E.Message; end; finally end; end; gnostice.com/docs/xtremedocumentstudio_delphi/frames.html?frmname=topic&frmfile=vcl_gtxDocumentConverter_TgtDocumentConverter.html Entonces… Me surge otra duda … es posible ejecutar un programa java de consola desde Delphi? Porque la funcionalidad de extraer texto de un Pdf creo recordar que era posible hacerla en Java. Buenas fiestas y gracias. |
Herramientas | Buscar en Tema |
Desplegado | |
|
|
Temas Similares | ||||
Tema | Autor | Foro | Respuestas | Último mensaje |
¿Qué información debo leer para saber de Facturación Electrónica? | Carmelo Cash | Varios | 5 | 08-04-2015 11:08:47 |
Leer informacion en nodos de diferentes niveles de un archivo XML | cmfab | Varios | 2 | 24-10-2012 15:51:35 |
extraer informacion de un archivo .txt | richy08 | PHP | 8 | 16-10-2010 06:17:32 |
Leer un fichero PDF para grabar información en una Base de Datos | ALMERA | Impresión | 0 | 06-03-2009 14:13:54 |
Leer archivo de texto y extraer lineas de el | mp3968 | API de Windows | 1 | 19-05-2007 20:27:53 |
|