Skip to content
fpromero edited this page Jun 18, 2015 · 6 revisions

ENUNCIADO BÁSICO DEL TRABAJO

El trabajo debe permitir redactar un artículo completo que incluya una descripción breve del proyecto realizado con la empresa, una amplia descripción del software utilizado y algún ejemplo de la aplicabilidad real en las áreas de trabajo.

Para la descripción del software utilizado nos vamos a centrar de forma individual en aquellos puntos en los que el proyecto requería procesamiento lingüístico. Para cada uno de esos puntos se estudiarán que frameworks se disponen y que rendimiento ofrecen tanto en calidad de los resultados como en eficiencia.

Los puntos sujetos de estudio serán los siguientes:

  • Tokenización y POSTagging: Los resultados serán parecidos para todos los frameworks salvo en cuanto a rendimiento

  • Top Terms Extraction/Weigthing Schemes: Puede ser muy interesante, sobre todo por que si no hay muchos esquemas implementados se puede defender el haber utilizado el nuestro.

  • Language Detection

  • Collocations/Name Entity Recognition: De esto hicimos poco así que puede ser lo más descartable

  • Content Search (synonyms, etc.): Comparar búsquedas y sinónimos en elastic search y solr por ejemplo.

  • Document Clustering/Classification: Para el final, también es algo que se hizo solo con TEHANU

No será necesario hacer todo, con los cuatro más significativos sería suficiente.

Para cada uno de los puntos anteriores se desarrollará un trabajo dividido en las siguientes tareas

  • Frameworks: Para cada una de las tareas se seleccionarán aquellos frameworks que a priori puedan arrojar mejores resultados. Se describirán brevemente y se explicará la causa de su elección

  • Experiment Design: Se diseñara el experimento para evaluar los frameworks anteriores dentro del marco de la tarea elegida. Para lo cual se deberá responder, entre otras, a las siguientes preguntas: ¿qué se debe conseguir con la tarea? ¿con qué documentos se va a realizar la tarea? ¿qué métricas de calidad/rendimiento se utilizarán para evaluar los frameworks?

  • Implementation: Se implementarán las pruebas especificadas anteriormente.

  • Execution & Analysis: Se ejecutarán las pruebas, se obtendrán las mediciones según lo establecido y se interpretarán los resultados con el fin de tomar una decisión sobre el mejor de los frameworks.

ENTREGABLES

Artículo IEEE-CM

Partes del artículo

  1. Introducción (pendiente esquema)

  2. Descripción del Proyecto con DOCPATH mirar

  3. Descripción del software utilizado

  4. Conclusiones y Trabajo Futuro (pendiente esquema)

Trabajo Fin de Master

Según la normativa del Master MUTIA el trabajo fin de master deberá contener al menos los siguientes apartados, claramente identificados:

  • Un documento de hasta 30 páginas en formato artículo de revista, en donde describa el estado del arte del tema de investigación elaborado, la memoria de los trabajos de investigación llevados a cabo y la propuesta de líneas futuras (anteproyecto de posible tesis doctoral).
  • En dos anexos, se presentará un breve CV del candidato (incluyendo publicaciones y congresos en su caso) y un resumen de cada una de las asignaturas de máster realizadas (una o dos páginas para cada una de ellas, excepto las que tengan mayor incidencia en la investigación del candidato, que podrán redactarse con más detalle).

Por lo tanto el entregable se subdivide en los siguientes subentregables.

2.1. Artículo

2.2. Currículum vitae del autor:

2.3. Informe sobre las asignaturas cursadas:

2.4. Presentación para el TFM

Documentación relacionada:

ESTRUCTURA DE DESGLOSE DE TRABAJOS

Estructura de Desglose del Trabajo