Análisis de rendimiento de modelos basados en aprendizaje por transferencia con TensorFlow y TensorRT

Hernández González, Nicolás

View/Open

Export Citations

Date

2023

URI

http://riull.ull.es/xmlui/handle/915/32397

Abstract

En los últimos años hemos podido observar un vertiginoso auge de la inteligencia artificial, tal es así, que nos resultaría difícil encontrar algún campo en el que no se haya aplicado de una u otra forma. Este crecimiento ha estado encabezado de forma general por el Machine Learning, y de forma particular por el Deep Learning, subcampo del citado Machine Learning, que se diferencia de los modelos tradicionales por el uso de redes neuronales y un abanico de aplicaciones más amplio. No obstante, las redes neuronales tienen un serio inconveniente que puede provocar que muchos se replanteen su uso, el diseño de una red desde cero es una tarea ardua y costosa. En este trabajo se pretende mostrar cómo podemos adaptar una red preentrenada a un propósito específico para el cual estaba preparada inicialmente, lo cual se conoce como transferencia de conocimiento. La aplicación seleccionada para la prueba de concepto es el reconocimiento facial, y forma parte del objetivo del proyecto que la aplicación pueda ser ejecutada en dispositivos IoT. Se evaluará el rendimiento y eficiencia de los modelos generados empleando para ello tanto un ordenador de propósito general como un dispositivo NVIDIA Jetson AGX Orin, que está específicamente está diseñado para optimizar procesos de Inteligencia Artificial. Para el desarrollo de los modelos emplearemos la biblioteca TensorFlow, mientras que para la optimización de los procesos de inferencia usaremos la SDK de NVIDIA TensorRT.

In recent years we have seen a dizzying rise in artificial intelligence, so much so that it would be difficult to find any field in which it has not been applied in one way or another. More specifically, Deep Learning, the subfield of artificial intelligence that uses neural networks, is the one that has been developed the most due to the possibilities it offers compared to more traditional models. However, neural networks have a severe drawback that may cause many to rethink their use. Designing a network from scratch is an arduous and costly task. In this work, we intend to show how we can adapt a pre-trained network to a specific purpose for which it was initially prepared, known as knowledge transfer, where we have chosen an application that has a place within the IoT, such as facial recognition. The performance and efficiency of the generated models will be evaluated using a general-purpose computer and the NVIDIA Jetson AGX Orin device, designed to optimize Artificial Intelligence processes. We will use the TensorFlow library to develop the models and the NVIDIA TensorRT SDK to optimize the inference processes.

Licencia Creative Commons (Reconocimiento-No comercial-Sin obras derivadas 4.0 Internacional)

Except where otherwise noted, this item's license is described as Licencia Creative Commons (Reconocimiento-No comercial-Sin obras derivadas 4.0 Internacional)