Análisis en tiempo real del flujo de pasajeros en las estaciones de tranvía mediante IA y visión por computador
Autor
Oliva García, JaimeFecha
2024Resumen
The present work addresses the development of a person detection and tracking system
using the Jetson Nano platform, Raspberry PI V2.1 camera and artificial intelligence
models based on YOLOv8. The main objective of the project is to implement a system
capable of detecting and counting people in various environments through the analysis
of pre-recorded videos. To achieve this, two main components were developed: a main
script and a tracking module.
The main script is responsible for video capture, object detection, definition of areas of
interest, and visualization of results. Several YOLOv8 models (from YOLOv8n to YOLOv8l)
were employed, with YOLOv8s finally being selected for its optimal balance between
accuracy and speed. The tracking module, on the other hand, tracks the detected people
across video frames, assigning unique identifiers and maintaining continuous tracking.
Tests were conducted with two pre-recorded videos: one of a plaza and another of a
train station. In the first case, the system successfully detected and counted people with
100% accuracy. In the second case, although the detection was satisfactory, the counting
was not as accurate due to the lower video quality and greater recording distance.
In conclusion, the results obtained demonstrate the effectiveness of the developed
system and suggest future improvements, such as real-time implementation, model optimization,
and the detection of other objects, which would expand the system’s capabilities
for security and flow monitoring applications. El presente trabajo aborda el desarrollo de un sistema de detección y seguimiento de
personas utilizando la plataforma Jetson Nano, la cámara Raspberry PI V2.1 y modelos
de inteligencia artificial basados en YOLOv8. El objetivo principal del proyecto es implementar
un sistema capaz de detectar y contar personas en diversos entornos mediante el
análisis de vídeos pregrabados. Para ello, se desarrollaron dos componentes principales:
un script principal y un módulo de seguimiento.
El script principal se encarga de la captura de vídeo, la detección de objetos, la
definición de áreas de interés y la visualización de los resultados. Se emplearon varios
modelos de YOLOv8 (desde YOLOv8n hasta YOLOv8l), seleccionando finalmente el modelo
YOLOv8s por su balance óptimo entre precisión y velocidad. El módulo de seguimiento,
por su parte, rastrea las personas detectadas a lo largo de los fotogramas del vídeo,
asignando identificadores únicos y manteniendo un seguimiento continuo.
Las pruebas se realizaron con dos vídeos pregrabados: uno de una plaza y otro de una
estación de tren. En el primer caso, el sistema logró detectar y contar las personas con
una precisión del 100 %. En el segundo caso, aunque la detección fue satisfactoria, el
conteo no fue tan preciso debido a la menor calidad del vídeo y la mayor distancia de
grabación.
En conclusión, los resultados obtenidos demuestran la eficacia del sistema desarrollado
y sugieren futuras mejoras, como la implementación en tiempo real, la optimización de
modelos y la detección de otros objetos, lo que expandiría las capacidades del sistema
para aplicaciones de seguridad y monitorización de flujo de personas.