Aplicación de minería de datos para predecir la deserción estudiantil en la facultad de ingeniera de la Universidad del Magdalena
Aplicación de minería de datos para predecir la deserción estudiantil en la facultad de ingeniera de la Universidad del Magdalena
Date
2021
Authors
Gonzalez Danies, Janer Alberto
Journal Title
Journal ISSN
Volume Title
Publisher
Universidad del Magdalena
Abstract
El presente trabajo es un reporte final de los resultados obtenidos al emplear métodos de
aprendizaje de máquinas para predecir el riesgo de deserción de los estudiantes de la
Facultad de Ingeniería de la Universidad del Magdalena. En el desarrollo del proyecto se
llevaron a cabo diferentes etapas propias de un proceso de minería de datos, desde la
recopilación de datos, limpieza y preparación, extracción de características, y la aplicación
de métodos de aprendizaje de máquinas supervisado. La principal fuente de datos utilizada
en el proyecto fue el sistema de información de admisiones y registro de la Universidad,
del cual se incluyeron tanto variables de tipo socio-demográficas como de tipo académico
de una muestra de estudiantes de la Facultad de Ingenieria, registrados en un periodo de
tiempo del 2014 hasta 2019. La muestra que se conformó contiene casos de estudiantes
que no culminaron sus estudios, y estudiantes cuyo proceso de formación no se había
visto en riesgo hasta la fecha de recopilación de los datos. Los datos recopilados fueron
sometidos a diferentes procesos de limpieza y transformación para constituir un conjunto
de datos que permitiera utilizar métodos de aprendizaje de máquinas no supervisados, y
supervisados. En este trabajo se utilizaron métodos de aprendizaje no supervisado para
encontrar estructuras y patrones en los datos que no son aparentemente observables; sin
embargo, ninguno de los métodos implementados generó grupos compactos u
homogéneos. Por otra parte, los métodos de aprendizaje supervisado generaron modelos
de predicción prometedores, alcanzado tasas de precisión por encima del 95%,
especialmente el random forest, y el método los k-vecinos más cercanos. A partir de estos
resultados se puede concluir que sería posible emplear los modelos de predicción
generados por estos métodos para predecir de manera temprana el riesgo de un estudiante
de desertar en la Facultad de Ingeniería
Description
Keywords
Minería de datos,
Machine learning,
Facultad Ingenieria,
Aprendizaje automatico,
Redes neuronales,
Deserción académica,
Random forest