La experiencia en educación nos facilita conocer las problemáticas a las que se enfrentan quienes participan en este ámbito, en esto se fundamenta nuestra propuesta de valor además del conocimiento del tratamiento de datos, técnicas de Machine Learning y visualización.
A partir de los datos propios de la organización y definidos los requerimientos de sus directivos aplicamos la metodología CRISP-DM (Cross Industry Standard Process for Data Mining), cuyas etapas son:
- Entendimiento de la situación: Es vital comprender el problema que se aborda y definir su alcance, realizando las preguntas necesarias que se responderán en la etapa final.
- Comprensión de los datos: El siguiente paso es la recolección de los datos necesarios, determinamos la importancia relativa de cada una de las variables de acuerdo con los objetivos planteados inicialmente.
- Preparación de los datos: Es la fase en la cual limpiamos y transformamos los datos, eliminando variables que no aportan al modelo y creando otras.
- Modelado: Ajustamos modelos de aprendizaje automático, supervisados y no supervisados, a los datos preparados, dentro de los cuales los más utilizados son los Árboles de Decisión, Random Forest, Support Vector Machine, Regresión Lineal y Logística, Naive Bayes, K-Means, K-Modes, entre otros.
- Evaluación del modelo: Antes de la puesta en producción se verifican las métricas necesarias para comprobar la calidad del modelo.
- Despliegue: Finalmente se dispone de los resultados respondiendo a las preguntas planteadas inicialmente, buscando comunicarlos a través de la visualización y el storytelling.