FTP | CCD | Buscar | Trucos | Trabajo | Foros |
|
Registrarse | FAQ | Miembros | Calendario | Guía de estilo | Temas de Hoy |
|
Herramientas | Buscar en Tema | Desplegado |
|
#1
|
||||
|
||||
Cita:
Primero, si ya tienes resuelto como extraer el texto de los documentos de word, que por mucho es el paso MAS dificil, entonces lo puedes colocar en un campo TEXT de la BD de postgres. Una vez alli, montas una busqueda de texto completo: http://www.postgresql.org/docs/9.1/s...extsearch.html Y obtendras resultados es milisegundos (con los indices adecuados, que te lo explica la documentacion) y busquedas tipo google. El resto es mantener actualizado el cache del contenido que metes en la BD (recuerda, es el texto de word, NO el archivo). Para eso, puedes usar una comparación de timestamp + tamaño de archivo y/o MD5 de estos + un detector de que el archivo ha cambiado.
__________________
El malabarista. |
#2
|
||||
|
||||
Cita:
Interesante y práctico, lo voy a probar y les comento. Lo único aquí sería la cantidad de texto que entraría en el campo text, pero veremos qué pasa. Con la sugerencia del compañero D-MO, está muy interesante el proceso, sólo que los equipos clientes son todo Microsoft y los usuarios no tienen tiempo (ni ganas!!) de aprender como cambiar el formato de su archivo de .odt a .docx, aparte de que algunas cosas tales como texto resaltado, comentarios y otras cosas se manejan distinto de un formato a otro. Pero para documentos más sencillos funciona perfectamente. Cuando hago la búsqueda directa en .docx se tarda unos minutos, pero al hacer la conversión, aún cuando se está realizando en el servidor Linux se tarda un poco más. Pero muy interesante el método. Gracias a todos.
__________________
No lo intentes!. Hazlo o no lo hagas, pero no lo intentes !!! (Yoda) |
#3
|
||||
|
||||
Cita:
Saludos |
#4
|
||||
|
||||
Solucionado
Muchas gracias a todos los que se tomaron el tiempo de leer, pero principalmente gracias a los que aportaron ideas.
Entre que ya había logrado sacar la información de los Word y con las sugerencias de mamcx y de D-MO se solucionó el problema, además de otra solución colateral. Del modo en que en un principio lo estaba haciendo, mantenía oculto Word y realizaba las búsquedas en cada uno de los archivos, pero si mientras se ejecutaban las búsquedas, abrías Word entonces se quedaba abierto permanentemente o se cerraba (según la parte de código que se estuviera ejecutando) y se mostraba todo el proceso, pero no dejaba trabajar en ningún otro archivo (algo faltó por ahí al instanciar ). Con la solución final, como todo se hace en el servidor, es mucho más rápido y no "molestamos" a Microsoft con nada. Gracias a todos. Son geniales!!! Eduardo Laguna
__________________
No lo intentes!. Hazlo o no lo hagas, pero no lo intentes !!! (Yoda) |
#5
|
||||
|
||||
Me alegra saber que sirvió de algo las aportaciones que se hicieron. Sería bueno que detallaras un poco mas de como quedó el proceso final para que nos sirva de retroalimentación.
Saludos |
#6
|
||||
|
||||
Cita:
Eduardo Laguna
__________________
No lo intentes!. Hazlo o no lo hagas, pero no lo intentes !!! (Yoda) |
#7
|
||||
|
||||
No te apures, que no hay prisa
|
|
|
Temas Similares | ||||
Tema | Autor | Foro | Respuestas | Último mensaje |
adjuntar documentos de word | pabloloustau | Conexión con bases de datos | 5 | 04-04-2010 01:13:04 |
Documentos de word | zidfrid | C++ Builder | 2 | 05-09-2008 02:17:11 |
Formatear documentos Word | abril0404 | Servers | 1 | 27-02-2008 14:23:25 |
documentos .dot(word) en delphi | CARSOFT_AR | Varios | 2 | 11-02-2005 17:39:25 |
documentos word | Albano | Varios | 0 | 12-01-2005 02:19:38 |
|