Análisis de rendimiento de modelos basados en aprendizaje por transferencia con TensorFlow y TensorRT
Author
Hernández González, NicolásDate
2023Abstract
En los últimos años hemos podido observar un vertiginoso auge de la inteligencia artificial, tal es así, que nos resultaría difícil encontrar algún campo en el que
no se haya aplicado de una u otra forma. Este crecimiento ha estado encabezado de forma general por el Machine Learning, y de forma particular por el Deep
Learning, subcampo del citado Machine Learning, que se diferencia de los modelos tradicionales por el uso de redes neuronales y un abanico de aplicaciones
más amplio. No obstante, las redes neuronales tienen un serio inconveniente que
puede provocar que muchos se replanteen su uso, el diseño de una red desde
cero es una tarea ardua y costosa.
En este trabajo se pretende mostrar cómo podemos adaptar una red preentrenada a un propósito específico para el cual estaba preparada inicialmente,
lo cual se conoce como transferencia de conocimiento. La aplicación seleccionada para la prueba de concepto es el reconocimiento facial, y forma parte del
objetivo del proyecto que la aplicación pueda ser ejecutada en dispositivos IoT.
Se evaluará el rendimiento y eficiencia de los modelos generados empleando
para ello tanto un ordenador de propósito general como un dispositivo NVIDIA
Jetson AGX Orin, que está específicamente está diseñado para optimizar procesos de Inteligencia Artificial. Para el desarrollo de los modelos emplearemos
la biblioteca TensorFlow, mientras que para la optimización de los procesos de inferencia usaremos la SDK de NVIDIA TensorRT. In recent years we have seen a dizzying rise in artificial intelligence, so much so
that it would be difficult to find any field in which it has not been applied in one
way or another. More specifically, Deep Learning, the subfield of artificial intelligence that uses neural networks, is the one that has been developed the most
due to the possibilities it offers compared to more traditional models. However,
neural networks have a severe drawback that may cause many to rethink their
use. Designing a network from scratch is an arduous and costly task.
In this work, we intend to show how we can adapt a pre-trained network to a
specific purpose for which it was initially prepared, known as knowledge transfer,
where we have chosen an application that has a place within the IoT, such as
facial recognition. The performance and efficiency of the generated models will
be evaluated using a general-purpose computer and the NVIDIA Jetson AGX
Orin device, designed to optimize Artificial Intelligence processes. We will use
the TensorFlow library to develop the models and the NVIDIA TensorRT SDK to optimize the inference processes.