Análisis Predictivo del Rendimiento Académico en Estudiantes Canarios de Primaria usando Modelos Lasso
Author
Barbuzano Narvaez, SebastianDate
2024Abstract
La educación es crucial para el desarrollo individual y social, promoviendo el
crecimiento económico, progreso cultural y mejora de la calidad de vida. Predecir el
rendimiento académico es esencial para identificar a estudiantes en riesgo de fracaso
escolar y tomar medidas preventivas. Este trabajo tiene como objetivo construir
modelos predictivos del rendimiento académico de estudiantes de primaria utilizando
datos de la Agencia Canaria de Calidad Universitaria y Evaluación Educativa
(ACCUEE) de estudiantes en tercer grado en 2015/16 y en sexto grado en 2018/19.
La metodología emplea técnicas de machine learning, específicamente modelos
Lasso. Se desarrollaron tres modelos para predecir calificaciones en matemáticas,
lengua y rendimiento académico general (agregado). Los principales resultados son:
el modelo agregado tiene la mejor capacidad predictiva debido a su completitud, a
pesar de tener la muestra más pequeña; los signos y magnitudes de las variables
relevantes son consistentes entre modelos y con la literatura, indicando una
explicación uniforme para matemáticas, lengua y el agregado; el efecto inercia es
significativo en todos los modelos, capturando la mayor parte de la variabilidad; las
variables explicativas son más relevantes en conjunto que por separado; la
coincidencia de los signos en las predicciones cruzadas muestra una fuerte
interseccionalidad entre variables; y las principales diferencias entre modelos están
en las magnitudes, no en los signos. Education is crucial for individual and social development, promoting economic growth,
cultural progress, and improved quality of life. Predicting academic performance is
essential for identifying students at risk of academic failure and taking preventive
measures. This work aims to build predictive models of primary school students'
academic performance, using data from the Canary Agency for University Quality and
Educational Evaluation (ACCUEE) of students in the third grade in 2015/16 and in the
sixth grade in 2018/19. The methodology employs machine learning techniques,
specifically Lasso models. Three models were developed to predict grades in
mathematics, language, and overall academic performance (aggregate). The main
results are: the aggregate model has the best predictive capacity due to its
completeness, despite having the smallest sample; the signs and magnitudes of the
relevant variables are consistent across models and with the literature, indicating a
uniform explanation for mathematics, language, and the aggregate; the inertia effect is
significant in all models, capturing most of the variability; the explanatory variables are
more relevant together than separately; the matching of signs in cross-predictions
shows a strong intersectionality between variables; and the main differences between
models are in magnitudes, not in signs La educación es crucial para el desarrollo individual y social, promoviendo el
crecimiento económico, progreso cultural y mejora de la calidad de vida. Predecir el
rendimiento académico es esencial para identificar a estudiantes en riesgo de fracaso
escolar y tomar medidas preventivas. Este trabajo tiene como objetivo construir
modelos predictivos del rendimiento académico de estudiantes de primaria utilizando
datos de la Agencia Canaria de Calidad Universitaria y Evaluación Educativa
(ACCUEE) de estudiantes en tercer grado en 2015/16 y en sexto grado en 2018/19.
La metodología emplea técnicas de machine learning, específicamente modelos
Lasso. Se desarrollaron tres modelos para predecir calificaciones en matemáticas,
lengua y rendimiento académico general (agregado). Los principales resultados son:
el modelo agregado tiene la mejor capacidad predictiva debido a su completitud, a
pesar de tener la muestra más pequeña; los signos y magnitudes de las variables
relevantes son consistentes entre modelos y con la literatura, indicando una
explicación uniforme para matemáticas, lengua y el agregado; el efecto inercia es
significativo en todos los modelos, capturando la mayor parte de la variabilidad; las
variables explicativas son más relevantes en conjunto que por separado; la
coincidencia de los signos en las predicciones cruzadas muestra una fuerte
interseccionalidad entre variables; y las principales diferencias entre modelos están
en las magnitudes, no en los signos. Education is crucial for individual and social development, promoting economic growth,
cultural progress, and improved quality of life. Predicting academic performance is
essential for identifying students at risk of academic failure and taking preventive
measures. This work aims to build predictive models of primary school students'
academic performance, using data from the Canary Agency for University Quality and
Educational Evaluation (ACCUEE) of students in the third grade in 2015/16 and in the
sixth grade in 2018/19. The methodology employs machine learning techniques,
specifically Lasso models. Three models were developed to predict grades in
mathematics, language, and overall academic performance (aggregate). The main
results are: the aggregate model has the best predictive capacity due to its
completeness, despite having the smallest sample; the signs and magnitudes of the
relevant variables are consistent across models and with the literature, indicating a
uniform explanation for mathematics, language, and the aggregate; the inertia effect is
significant in all models, capturing most of the variability; the explanatory variables are
more relevant together than separately; the matching of signs in cross-predictions
shows a strong intersectionality between variables; and the main differences between
models are in magnitudes, not in signs.