Desafíos educativos, soluciones tecnológicas: La Minería de Datos como motor de cambio
Gabriel Novillo Rangone, defendió su tesis doctoral en Ingeniería Informática en la que desarrolló un modelo automatizado basado en Minería de Datos Educativos que ofrece respuestas a problemas presentes en instituciones formativas.
El trabajo, recupera evidencias y experiencias aplicadas en diversos ámbitos y las aplica a un modelo tecnológico que podría contribuir a la mejora del rendimiento académico, de la calidad educativa y la gestión institucional, entre otras.
La tesis fue dirigida por el Dr. Germán Montejano y codirigida por la Dra. Ana Garis. En esta entrevista, Gabriel nos cuenta cómo y por qué encaró este trabajo y la potencialidad del modelo desarrollado.
¿Qué te motivó a trabajar en el campo de la Minería de Datos Educativos?
En los últimos años he leído, investigado, y trabajado en el campo del Machine Learning y el Deep Learning para distintas áreas del conocimiento como la bioinformática, las estadísticas oficiales, y el comercio electrónico entre otros, y pude apreciar que rápido estas áreas utilizaron estas tecnologías para obtener provecho y un máximo rendimiento en sus tareas cotidianas. Como soy Docente Universitario me pregunte dónde estaba parada la educación y sus instituciones con respecto a esta carrera. Fue ahí donde encontré que había otras áreas que habían utilizado estas tecnologías sacando aún más provecho de las mismas como la industria armamentística, las tecnológicas, y las relacionadas a los medicamentos y la genética. Como Docente e Investigador me propuse encontrar las causas que hacen que algunas áreas del conocimiento se beneficien más que la Educación y sus instituciones, en un mundo donde hay potencia computacional, nuevos paradigmas de programación y Big Data Educativa, es decir, todas las condiciones generales alineadas.
El resultado fue que el problema que tienen las Instituciones Educativas es que no cuentan con Científicos de Datos en su gran mayoría, y si los tienen, estos no cuentan con todos los roles o conocimientos necesarios para poder llevar adelante un flujo completo de Minería de Datos Educativa aplicando Machine Learning. Esto se debe a dos causas principales. Por un lado, al ser un área del conocimiento nuevo existe pocos profesionales, y por otro lado los pocos que existen son convencidos por las industrias más rentables que antes mencionamos.
¿Por qué es importante automatizar procesos en la Minería de Datos Educativos?
Automatizar procesos significa poder aplicar Machine Learning (conocido como Inteligencia Artificial) en un Modelo de Minería de Datos Educativa, sin la necesidad de tener que contar con científicos de datos o contando con algunos roles de los mismos, esto permite a las instituciones educativas poder extraer conocimiento complejo para mejorar el sistema de toma de decisiones basado en información. En resumen, significa poder democratizar la utilización de la última tecnología que ha irrumpido en el mundo e intentar disminuir la brecha de la Educación con las áreas mas avanzadas.
¿Cuáles son los principales desafíos educativos que el modelo propuesto busca resolver?
Los desafíos están en función del usuario final del sistema educativo, ya sean estudiantes, docentes, investigadores, directivos y sus problemas. Por ejemplo, los más conocidos y trabajados son el Bajo rendimiento escolar, entendido como la dificultad de algunos estudiantes para alcanzar los objetivos de aprendizaje establecidos en su nivel educativo. Esto puede deberse a problemas como la falta de motivación, la falta de habilidades para el estudio, la falta de apoyo familiar, entre otros factores. Las Desigualdades educativas se refieren a las diferencias en el acceso a la educación, la calidad de la enseñanza y los resultados educativos entre diferentes grupos de la población. Estas desigualdades pueden estar relacionadas con la clase social, el género, la etnia, la lengua materna, etc.
La Falta de calidad en la enseñanza, se refiere a la falta de preparación de los docentes, la falta de recursos pedagógicos, la falta de apoyo institucional, entre otros factores que afectan la calidad del proceso educativo. La Falta de adaptación a las necesidades individuales, en las que muchas veces, el sistema educativo no se adapta a las necesidades individuales de los estudiantes, lo que puede generar frustración y desmotivación en ellos. Además, la Sobrecarga curricular, ya que, en algunos sistemas educativos, la currícula es demasiado extensa y exigente, lo que puede generar estrés y ansiedad en los estudiantes y docentes, y afectar negativamente la calidad de la enseñanza.
Otro inconveniente es la falta de recursos educativos adecuados lo que puede afectar negativamente la calidad de la enseñanza y el aprendizaje de los estudiantes. Por ejemplo, si los estudiantes no tienen acceso a libros de texto o a materiales didácticos adecuados, tendrán dificultades para comprender los conceptos y aplicarlos en situaciones reales. La falta de tecnología y acceso a internet también puede limitar el aprendizaje y la investigación de los estudiantes. Por otro lado, la falta de formación docente adecuada puede afectar la calidad de la enseñanza y el aprendizaje de los estudiantes. Los docentes necesitan estar actualizados en cuanto a los métodos de enseñanza y las nuevas tecnologías educativas, y tener habilidades de gestión de aula y de atención a la diversidad.
Otro obstáculo preocupante, es la deserción Escolar o Universitaria, que por lo general es multifactorial pero al analizar los datos como su asistencia, calificaciones y comportamiento, se pueden identificar patrones que indican que causas influyeron de manera más significativa. La falta de motivación y compromiso de los estudiantes puede afectar negativamente su rendimiento académico y su capacidad para aprender. Es importante que los estudiantes se sientan motivados y comprometidos en el proceso educativo para lograr mejores resultados.
El enfoque en la memorización en lugar del aprendizaje significativo puede limitar la capacidad de los estudiantes para aplicar su conocimiento en situaciones reales. En lugar de simplemente memorizar conceptos y fórmulas, es importante que los estudiantes comprendan la lógica detrás de ellos y aprendan a aplicarlos en diferentes contextos. La falta de financiamiento adecuado es un problema común en muchos sistemas educativos, especialmente en países en desarrollo. La falta de recursos financieros puede afectar la calidad de la enseñanza y el aprendizaje, y limitar el acceso a la educación para los estudiantes de bajos ingresos.
Finalmente, la brecha de habilidades hace referencia a la discrepancia entre las habilidades que los empleadores necesitan y las habilidades que los graduados universitarios tienen. En muchos casos, los empleadores reportan que los graduados universitarios no tienen las habilidades necesarias para desempeñarse en sus trabajos; lo que se suma a la falta de adaptación a las necesidades cambiantes. Las necesidades de los estudiantes y del mundo laboral están en constante evolución. Es importante que los sistemas educativos se adapten a estas necesidades cambiantes y proporcionen una educación relevante y actualizada para los estudiantes. Esto puede requerir una revisión periódica del currículum, la implementación de nuevas tecnologías educativas y la formación continua de los docentes.
¿Por qué trabajaste validando el modelo en la Universidad Nacional de Villa Mercedes? ¿Qué encontraste como problemática allí y qué como posible solución?
Como soy docente exclusivo de la UNVIME y codirijo junto al Dr. German Montejano un Proyecto de Investigación denominado “Búsqueda de Conocimiento aplicando Ciencia de Datos en el Dominio de Educación”, pude tener acceso a información para comenzar a entrenar modelos para predecir en principio la deserción universitaria. Luego vino información de distintas Universidades Publicas que fueron conociendo nuestras publicaciones y hallazgos. La solución propuesta fue la presentada en la Tesis Doctoral de Ingeniería en Informática de la UNSL, es decir, un modelo completo de Minería de Datos Educativa para extraer conocimiento aplicando Machine Learning e Interpretable Machine Learning.
¿Con qué herramientas y técnicas trabajaste para implementar o desarrollar el modelo propuesto?
Se trabajó con un stack de herramientas tecnológicas que permite hacer más fácil la tarea en este momento como puede ser el lenguaje de programación Python, las librerías AutoSklearn, Pycaret, Sweetviz, RapidMiner, NumPy, Pandas ,Matplotlib, Seaborn, Scikit-learn, SHAP, Eli5, Feature importance, FeatureTools, entre otras.
¿Este modelo puede ser replicable a otras instituciones de educación superior?
Si, claro, este modelo no solo se puede replicar en otras instituciones de educación superior, sino que se puede utilizar en Institución de todos los niveles (inicial a universitario), tanto público como privado, como así también en modalidad presencial, virtual o híbrido.