-
Notifications
You must be signed in to change notification settings - Fork 21
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
No es posible cargar documentos ODT #20
Comments
Una búsqueda rápida en google no aporta luz al respecto. Sobre DOC, aunque lo dudo, queda pendiente investigar si la librería opendocx es back-compatible y también puede cargar DOCs. Pregunta a Tryolabs: ¿Cómo tenían previsto acometer esto? ¿Tenían localizada ya alguna librería? |
Marc, Una de las posibilidades que consideramos para la extracción de texto en formato doc fue el uso de Antiword, aunque es necesario correrlo como un proceso aparte, ya que no es una biblioteca. Para trabajar con documentos de Open/Libre office debemos buscar que biblioteca se puede utilizar. |
Gracias Mauro. WebODT hace uso de Abiword (a su vez basado en wvWare que como Antiword también tiene versión para windows) por lo que podríamos reducir las dependencias (abiword para odt & docs?) Sea como sea, no he encontrado ninguna librería capaz de leer DOCs o ODTs sin hacer uso de herramientas de terceros y eso es un handicap de cara a la versión "portable" que tenemos en mente. Hasta ahora libreQDA no tiene más dependencias que django y eso es era una buena noticia. Cuanto más se complica la instalación (pe: con requisitos de soft como anti/abiword) más se nos complica la idea de "libreQDA para escritorio". Si os parece, lo dejamos en standby a ver que se nos ocurre entre todos. ¿Publicamos aquí ideas y avances? Discutimos en el lado libreQDA hasta que punto los dos formatos son un "must be" para la 1.0. |
Al intentarlo el sistema devuelve un:
"Tipo de archivo no soportado"
Revisando código, se ha implementado la importación de TXT, RTF, PDF y DOCX.
Habría que editar "text_extraction.py" para incorporar ODT y DOC.
The text was updated successfully, but these errors were encountered: