- Daniel Vallejo Aldana
- Oscar D. Zendejas Rangel
- Emilio Villa Cueva
En este repositorio se encuentra el notebook utilizado para la realzación del proyecto, además de los archivos usados para la implementación y los archivos generados por el script.
Objetivo: proponer y desarrollar un flujo de pre-procesamiento para mejorar la calidad de las imágenes y detectar los objetos que componen la imagen, su ubicación y clasificación por similitud de acuerdo a categorías generales incluyendo sellos, firmas, texto a mano, texto a máquina y fotografías.
- Analizis de muestras al azar para la obtención de etiquetas específicas. La obtención se realizó medianete roboflow, ya que es una plataforma muy amigable, y fácil de usar. Es de interés mencionar que sólo se contemplaron las imágenes de expedientes, ya que en éstas se encontraban la mayor cantidad posible de objetos a detectar.
- Luego de obtener las etiquetas trabajamos sobre un modelo existente de YOLOv5 en pytorch. Este modelo funciona como cualquier red neuronal, necesitamos darle imágenes de entrenamiento, en esta fase sí usamos lotes de los 3 bancos de datos. Para que no hubiera problemas al detectar, agremamos las etiquetas existentes de OCB, las cuales cuentan con 20 etiquetas genéricas(auto, avión, etc.).
- Para la limpieza de imágenes usamos una arquitectura compuesta por dos redes UNet, esto nos ayuda a binarizar las imágenes y aplicarle "filtros". Primero comenzamos por parches de la fotografía completa, posteriormente al entrenar la red comenzamos a ingresasr imágenes completas y resultó muy bien.