Técnicas de machine learning para la predicción de la temperatura de punto de rocío aplicado al mantenimiento predictivo de un telescopio astronómico
Author
García Hernández, DanielDate
2023Abstract
En este trabajo se realiza una comparativa de modelos para la predicción de la temperatura del punto de rocío con el objetivo de implementar uno de ellos en el Sistema
de Control de Telescopios Nocturnos (Control TTNN) del Instituto de Astrofísica de
Canarias (IAC). Se realiza un preprocesamiento de los datos y se evaluan diferentes
enfoques de aprendizaje automático, tanto univariable como multivariable, y se analizan
sus resultados.
El preprocesamiento de los datos efectuado incluye una detección y suavizado de
anomalías, un tratamiento de valores faltantes y una selección de características, así
como de un análisis de las propiedades de las variables contempladas. Se obtiene que el
preprocesamiento proporciona una mejora efectiva en las predicciones, obteniendo tras
las dos primeras etapas una Raíz del Error Cuadrático Medio (RMSE) un 13.24 % menor
que en el conjunto original.
Utilizando 10 muestras diferentes del conjunto de pruebas, se calcula la media de los
resultados obtenidos por cada modelo. Los modelos son configurados con regresores
externos y se ajustan los hiperparámetros durante la fase de entrenamiento y validación.
Los resultados muestran que el modelo Gradient Boosting Regressor (GBR) de ScikitLearn obtiene el mejor rendimiento, logrando un RMSE de 4.81º. Además, otras métricas
respaldan la superioridad del GBR, incluyendo las referentes al intervalo de predicción,
dado que obtiene el menor Error Medio de Cobertura (11.26) y el Porcentaje de Cobertura
más alto (66.25). En contraste, el modelo Extreme Gradient Boosting (XGBoost) muestra
un RMSE de 7.21º, lo cual representa una diferencia de 2.40 grados en comparación con el
GBR. Basándose en estos resultados, se selecciona el modelo GBR para su implementación
en el Sistema de Control de TTNN. In this study, a comparison of models is conducted to predict the dew point temperature
with the objective of implementing one of them in the Nighttime Telescope Control
System (Control TTNN) at the Institute of Astrophysics of the Canary Islands (IAC). Data
preprocessing is performed, evaluating different machine learning approaches, both
univariate and multivariate, and analyzing their results.
The data preprocessing includes anomaly detection and smoothing, treatment of
missing values, feature selection, and an analysis of the variables’ properties. It is found
that preprocessing effectively improves predictions, achieving a 13.24 % lower Root Mean
Square Error (RMSE) than that of the original dataset after the first two stages.
Using 10 different samples from the test set, the average results obtained by each
model are calculated. The models are configured with external regressors, and the
hyperparameters are tuned during the training and validation phase. The results indicate
that the Gradient Boosting Regressor (GBR) model from Scikit-Learn performs the best,
achieving an RMSE of 4.81º. Furthermore, other metrics support the superiority of GBR,
including those related to the prediction interval, as it has the lowest Mean Coverage
Error (11.26) and the highest Coverage Percentage (66.25). In contrast, the Extreme
Gradient Boosting (XGBoost) model exhibits an RMSE of 7.21º, representing a difference
of 2.40 degrees compared to GBR. Based on these findings, the GBR model is selected for
implementation in the TTNN Control System.