RT info:eu-repo/semantics/bachelorThesis T1 Localizador de códigos de barras mediante inteligencia artificial A1 Yanes Mesa, Claudio Néstor A2 Grado en Ingeniería Informática K1 Código de barras K1 Machine learning K1 Segmentación semántica AB Los códigos de barras se diseñaron como una forma de representar información cortaalfanumérica en etiquetas que luego eran leídas por dispositivos electrónicos, nacidosa la par que estos: los escáner laser. La tarea de decodificación en sí de los códigos sediseñó para que fuera trivial, mientras que el avance tecnológico estaba en la aplicaciónde la fotónica para recuperar los anchos de las barras y huecos entre ellas.No obstante, un rol muy importante en el proceso de lectura era dejado al usuario:la tarea de localización de los códigos de barras y alineación del lector con los mismos.Que a pesar de ser inmediato para un operario humano supone una tarea no despreciablepara un sistema de visión por ordenador.Este TFG se propone como reto que un dispositivo móvil sea capaz de detectar y marcartodos los códigos de barras presentes en el campo de visión de su cámara aprovechandolos avances en machine learning. Se ha partido de un banco de imágenes de códigos debarras. Estas imágenes han tenido que ser etiquetadas, para lo cual se ha desarrolladouna herramienta etiquetadora semiautomática.Tras el proceso de etiquetado del banco de imágenes, se han entrenado con él unaserie de modelos de machine learning. Estos modelos se basaron en la red de R-CNNpara las tarea de segmentación de instancia y para realizar segmentación semántica enDeepLabV3+ con variantes que usaban alternativamente ResNet o MobileNetV2 comobackbone de la red. El modelo basado R-CNN obtuvo un AP de 0.7554 y un tiempo deinferencia promedio de 79.16 ms, bastante por encima de nuestro tiempo objetivo de33 ms. Por otro lado, los modelos basados DeepLabV3+ consiguieron un AP de 0.8369y 0.7856 (con ResNet y MobileNetV2 respectivamente) y un satisfactorio tiempo deinferencia promedio de 20 ms para todas las variantes.Luego estos modelos han sido utilizados en una aplicación de Android con el finde evaluar su comportamiento en un teléfono móvil. En dicho dispositivo, los modelosbasados en DeepLabV3+ lograron un tiempo de inferencia promedio 127.0 ms y 89.83ms para las variantes utilizando ResNet y MobileNetV2 respectivamente, lo cual si bienno logra llegar al tiempo objetivo (33ms), sí que son resultados prometedores dada laplataforma de ejecución. Estos resultados se obtuvieron tras aplicar sobre los modelos eloptimizador de TensorFlow Lite.Los resultados de este TFG son en resumen: la herramienta etiquetadora semiautomática, varios modelos de machine learning para la detección de códigos de barras y unaaplicación Android con el mismo fin. YR 2022 FD 2022 LK http://riull.ull.es/xmlui/handle/915/29409 UL http://riull.ull.es/xmlui/handle/915/29409 LA es DS Repositorio institucional de la Universidad de La Laguna RD 22-nov-2024