Metodología CRISP-DM Parte 3 – Final

13 Jun, 2016

Realizado por nuestra SmartB María Victoria Díaz

En esta oportunidad te traemos la parte número 3 y final de la metodología CRISP-DM, en caso de que quieras validar las secciones anteriores puedes ir a los links:

Metodología CRISP-DM Parte 1

Metodología CRISP-DM Parte 2

Fase de evaluación

En esta fase se evalúa el modelo, teniendo en cuenta el cumplimiento de los criterios de éxito del problema.

Debe considerarse además, que la fiabilidad calculada para el modelo se aplica solamente para los datos sobre los que se realizó el análisis.

Es preciso revisar el proceso, teniendo en cuenta los resultados obtenidos, para poder repetir algún paso anterior, en el que se haya posiblemente cometido algún error.

Considerar que se pueden emplear múltiples herramientas para la interpretación de los resultados.

Las matrices de confusión Edelstein, 1999 son muy empleadas en problemas de clasificación y consisten en una tabla que indica cuantas clasificaciones se han hecho para cada tipo, la diagonal de la tabla representa las clasificaciones correctas.

Si el modelo generado es válido en función de los criterios de éxito establecidos en la fase anterior, se procede a la explotación del modelo. La figura N°7 Detalla las tareas que componen esta fase y los resultados que se deben obtener.

 
mv7

Figura N°7. Fase de evaluación ([CRISP-DM, 2000]).

 Las tareas involucradas en esta fase del proceso son las siguientes:

Evaluación de los resultados

En los pasos de evaluación anteriores, se trataron factores tales como la exactitud y generalidad del modelo generado.

Esta tarea involucra la evaluación del modelo en relación a los objetivos del negocio y busca determinar si hay alguna razón de negocio para la cual, el modelo sea deficiente, o si es aconsejable probar el modelo, en un problema real si el tiempo y restricciones lo permiten.

Además de los resultados directamente relacionados con el objetivo del proyecto

¿Es aconsejable evaluar el modelo en relación a otros objetivos distintos a los originales?

Esto podría revelar información adicional.

Revisión del proceso

El proceso de revisión, se refiere a calificar al proceso entero de DM, a objeto de identificar elementos que pudieran ser mejorados.

Determinación de futuras fases

Si se ha determinado que las fases hasta este momento han generado resultados satisfactorios, podría pasarse a la fase siguiente, en caso contrario podría decidirse por otra iteración desde la fase de preparación de datos o de modelación con otros parámetros.

Podría ser incluso que en esta fase se decida partir desde cero con un nuevo proyecto de DM 6.

Fase de implementación

En esta fase (figura N°8), y una vez que el modelo ha sido construido y validado, se transforma el conocimiento obtenido en acciones dentro del proceso de negocio, ya sea que el analista recomiende acciones basadas en la observación del modelo y sus resultados, ya sea aplicando el modelo a diferentes conjuntos de datos o como parte del proceso.

Por ejemplo, en análisis de riesgo crediticio, detección de fraudes, etc.

Generalmente un proyecto de Data Mining no concluye en la implantación del modelo, pues se deben documentar y presentar los resultados de manera comprensible para el usuario, con el objetivo de lograr un incremento del conocimiento.

Por otra parte, en la fase de explotación se debe asegurar el mantenimiento de la aplicación y la posible difusión de los resultados. 

Las tareas que se ejecutan en esta fase son las siguientes:

mv8

Figura No. 8. Fase de implementación ([CRISP-DM, 2000])

Plan de implementación

Para implementar el resultado de DM en la organización, esta tarea toma los resultados de la evaluación y concluye una estrategia para su implementación.

Si un procedimiento general se ha identificado para crear el modelo, este procedimiento debe ser documentado para su posterior implementación. 

Monitorización y Mantenimiento

Si los modelos resultantes del proceso de Data Mining son implementados en el dominio del problema como parte de la rutina diaria, es aconsejable preparar estrategias de monitorización y mantenimiento para ser aplicadas sobre los modelos.

La retroalimentación generada por la monitorización y mantenimiento pueden indicar si el modelo está siendo utilizado apropiadamente

Informe Final

Es la conclusión del proyecto de DM realizado.

Dependiendo del plan de implementación, este informe puede ser sólo un resumen de los puntos importantes del proyecto y la experiencia lograda o puede ser una presentación final que incluya y explique los resultados logrados con el proyecto. 

 Revisión del proyecto

En este punto se evalúa qué fue lo correcto y qué lo incorrecto, qué es lo que se hizo bien y qué es lo que se requiere mejorar