Preparación de Data con IBM SPSS Modeler

14 Jul, 2017

Realizado por nuestro SmartB Gerardo Delgado

Este artículo busca mostrar los conocimientos básicos, para la preparación de data con SPSS Modeler de IBM.

Esta etapa, es la que abarca la gran mayoría del tiempo en un proceso de descubrimiento de información y/o patrones.

Esto ocurre debido a la preparación de los datos mismos según sea necesario, encontrandp desde data corrupta, inconsistente o perdida.

Para cada caso, SPSS Modeler de IBM facilita herramientas y nodos para las distintas tareas a la hora de cumplir con estas actividades

1

Para el desarrollo de estas tareas, se tienen los siguientes nodos y actividades a continuación:

22

También contamos con el Nodo Type, bastante útil y con el cual por buena práctica debiese ser implementado en nuestros proyectos de análisis

33

Por cada una de las variables, seleccionamos:

Como manejar los Valores Missing (Descartar, cambiar su valor por algún otro por defecto, etc)

Tipo de Medida (propiamente Modeler lo detecta), el cual puede ser cambiado por el usuario, esto optimizará el análisis según el algoritmo o modelo a procesar.

El “Role” indicara en tratamiento que el propio modelo le dará a cada una de las variables (Entrada, salida, ambos, etc).

Finalmente, la preparación de la data es importante ya que:

Primero aumenta el valor de la precisión de los modelos.

Segundo evita o corrige los resultados equívocos.

Tercero mejora el análisis de los falsos positivos y negativos, entre otros.

 

Accionando así para la obtención de mejores y más robustos modelos de  predicción.