Aplicación de minería de datos para predecir la deserción estudiantil en la facultad de ingeniera de la Universidad del Magdalena

Abstract
El presente trabajo es un reporte final de los resultados obtenidos al emplear métodos de aprendizaje de máquinas para predecir el riesgo de deserción de los estudiantes de la Facultad de Ingeniería de la Universidad del Magdalena. En el desarrollo del proyecto se llevaron a cabo diferentes etapas propias de un proceso de minería de datos, desde la recopilación de datos, limpieza y preparación, extracción de características, y la aplicación de métodos de aprendizaje de máquinas supervisado. La principal fuente de datos utilizada en el proyecto fue el sistema de información de admisiones y registro de la Universidad, del cual se incluyeron tanto variables de tipo socio-demográficas como de tipo académico de una muestra de estudiantes de la Facultad de Ingenieria, registrados en un periodo de tiempo del 2014 hasta 2019. La muestra que se conformó contiene casos de estudiantes que no culminaron sus estudios, y estudiantes cuyo proceso de formación no se había visto en riesgo hasta la fecha de recopilación de los datos. Los datos recopilados fueron sometidos a diferentes procesos de limpieza y transformación para constituir un conjunto de datos que permitiera utilizar métodos de aprendizaje de máquinas no supervisados, y supervisados. En este trabajo se utilizaron métodos de aprendizaje no supervisado para encontrar estructuras y patrones en los datos que no son aparentemente observables; sin embargo, ninguno de los métodos implementados generó grupos compactos u homogéneos. Por otra parte, los métodos de aprendizaje supervisado generaron modelos de predicción prometedores, alcanzado tasas de precisión por encima del 95%, especialmente el random forest, y el método los k-vecinos más cercanos. A partir de estos resultados se puede concluir que sería posible emplear los modelos de predicción generados por estos métodos para predecir de manera temprana el riesgo de un estudiante de desertar en la Facultad de Ingeniería
Description
Keywords
Minería de datos, Machine learning, Facultad Ingenieria, Aprendizaje automatico, Redes neuronales, Deserción académica, Random forest
Citation
item.page.fuente