Casos de Uso

Segmentación

Consideremos la base de datos de un establecimiento que cuenta con una matrícula de 1.000 alumnos, que viven en las provincias de Osorno, Llanquihue y Chiloé. Respecto de cada alumno se tiene; su identificación, el valor de una variable numérica (Variable_1) y el valor de una segunda variable numérica (Variable_2), además de las coordenadas de su residencia (latitud y longitud).

Utilizando K-Means, una de las técnicas de Machine Learning de Aprendizaje No Supervisado, es posible realizar un análisis exploratorio para revelar agrupaciones naturales en este conjunto de datos y posteriormente visualizarlas en un mapa.

Los pasos a seguir son:

Con Python.

Revisión del formato de las variables.
Verificación de la existencia de datos faltantes.
Estandarización de las variables numéricas 1 y 2, ya que se encuentran en escalas distintas.
Ajuste del modelo K-Means, seleccionando la cantidad de clústers según el criterio del gráfico de Elbow.
«Verificamos que la cantidad de clústers (2) seleccionada es la correcta, ya que los registros se agrupan en torno a dos centroides, según el gráfico realizado con Python. Identificamos a los integrantes del clúster 0 con color azul, y a los del clúster 1 con naranjo».

Con Power BI.

Visualización geográfica de los clústers.
«Con Power BI es posible ver la distribución en la décima región de quienes componen ambas agrupaciones. Los alumnos pertenecientes al clúster 0 están presentes en la provincia de Chiloé y los del clúster 1 en las provincias de Osorno y Llanquihue».

Revisa el código en nuestro GitHub:

GitHub

Páginas: 1 2