Cita:
Empezado por elaguna
...sólo que los equipos clientes son todo Microsoft y los usuarios no tienen tiempo (ni ganas!!) de aprender como cambiar el formato de su archivo...
|
Si lees bien mi mensaje anterior verás que indiqué que el proceso de extracción debería ser automatizado. Veámos cual sería la secuencia (siguiendo la recomendación de mamcx).
- El usuario carga el archivo al sistema
- El sistema extrae extrae la metadata y texto del archivo (basándonos en como loook hace la búsqueda)
- Se almacena esta info en la BD, junto con la referencia al archivo original (¿path?)
Y al hacer búsquedas
- EL usuario ingresa un término de búsqueda
- Se hace la búsqueda en la bd (texto plano del doc)
- Al encontrar un match, se devuelve el archivo original (.docx)
De esta forma, en la bd tendrías un texto plano que simplificaría las búsquedas y al usuario de devuelves el archivo original.
Saludos