metodología datos

En un mundo impulsado por los datos y cada vez más proyectos en torno a su análisis con el objetivo de apoyar la toma de decisiones de las empresas, el diseño de las fases de un proyecto de analítica de datos se ha convertido en un elemento fundamental para el éxito del estudio.

La creación de una metodología sólida que guíe a los profesionales a través de las distintas etapas de análisis es crucial para obtener finalmente resultados precisos y significativos que se puedan aprovechar en beneficio del negocio y la dirección estratégica que debe tomar para abordar el futuro.

En este artículo, exploramos cómo diseñar las fases de un proyecto de analítica de datos y los pasos clave del proceso para cualquier tipo de contexto, como el de los corredores de seguros, que cada vez se preocupan más por el aprovechamiento del dato y el uso de tecnologías para ello.

Una metodología adecuada

Una metodología bien estructurada puede marcar la diferencia en el proceso de análisis de datos de los corredores de seguros y en cualquier otro sector impulsado por datos. Aunque existen diferentes metodologías, en este caso, nos fijaremos en la de CRISP-DM: CRoss-Industry Standard Process for Data Mining o Proceso Estándar Interindustrial para la Minería de Datos, ampliamente utilizada por los profesionales de ciencias de datos.

Esta metodología consta de 6 fases: Entender el negocio, entender los datos, prepararlos, crear el modelo, evaluarlo y desplegarlo.

Fase 1: Entender el negocio

Cualquier proyecto comienza con la comprensión del modelo de negocio en el que se desarrollará. Para lograrlo, primero se deben:

  1. Definir los objetivos de negocio y comprender a fondo lo que se desea lograr.
  2. Evaluar la situación determinando los recursos disponibles, requisitos del proyecto, evaluar riesgos y contingencias, y realizar un análisis de costo-beneficio.
  3. Establecer los objetivos técnicos de datos y cómo se medirá el éxito desde una perspectiva técnica.
  4. Crear un plan de proyecto, seleccionando las tecnologías y herramientas a utilizar y definiendo planes detallados para cada fase del proyecto.

Fase 2: Entender los datos

Esta fase se enfoca en identificar, recopilar y analizar conjuntos de datos para obtener los resultados del proyecto. Las cuatro tareas clave son:

  1. Recopilar datos iniciales y si es necesario, cargarlos en herramientas para su análisis.
  2. Examinar los datos y documentar sus propiedades iniciales, como formato, cantidad de registros y campos clave.
  3. Profundizar en los datos, consultándolos, visualizándolos e identificando relaciones entre ellos.
  4. Verificar la calidad de los datos, evaluando su limpieza o calidad y documentar cualquier problema encontrado.

Fase 3: Preparar los datos

El 80% del tiempo de desarrollo de un proyecto de datos es la preparación de los conjuntos de datos finales para el modelado. Tiene cinco tareas clave:

  1. Determinar qué conjuntos de datos se utilizarán y documentar los motivos de la inclusión o exclusión.
  2. Corregir, imputar o eliminar valores erróneos para mantener los datos lo más limpios posible.
  3. Construir datos calculando nuevos atributos que serán útiles.
  4. Integrar y combinar datos de varias fuentes para crear nuevos conjuntos de datos.
  5. Dar formato a los datos según sea necesario.
metodología datos

Fase 4: Crear el modelo

Suele ser la fase más corta del proyecto, aunque es probable que se construyan y evalúen varios modelos basados en varias técnicas diferentes con el fin de quedarnos con la que mejores resultados se obtengan. Esta fase consta de cuatro tareas:

  1. Seleccionar las técnicas de modelado determinando qué algoritmos se aplicarán.
  2. Generar el diseño de prueba y conjuntos de datos específicos para entrenamiento, prueba y validación.
  3. Modelo de compilación para ejecutar una función que nos genere una regresión líneal.
  4. Evaluar el modelo que proporciona mejores resultados en función del conocimiento del dominio, los criterios de éxito predefinidos y el diseño de la prueba.

Fase 5: Evaluar el modelo

La fase de evaluación analiza más ampliamente qué modelo técnico se adapta mejor al negocio y qué hacer a continuación.  Esta fase tiene tres tareas:

  1. Evaluar resultados preguntándose si los modelos cumplen con los criterios de éxito y cuál(es) debemos aprobar para el negocio.
  2. Revisar el trabajo realizado analizando si se pasó algo por alto y/o se ejecutaron correctamente todos los pasos.
  3. Determinar los siguientes pasos en función de las tres tareas anteriores: continuar con la implementación, iterar más o iniciar nuevos proyectos.

Fase 6: Desplegar el modelo

La utilidad de un modelo radica en su capacidad de proporcionar acceso a sus resultados. La complejidad de esta etapa puede variar significativamente según la amplitud de la implementación y se compone de cuatro tareas:

  1. Desarrollar y documentar un plan para implementar el modelo.
  2. Plan de monitorización, ajuste y optimización para evitar problemas durante la fase operativa de un modelo.
  3. Documentación y resumen del proyecto en un informe final de los resultados del proyecto.
  4. Revisión del proyecto y  análisis en retrospectiva sobre lo que salió bien, lo que podría haber sido mejor y cómo mejorar en el futuro.

El diseño de las fases en un proyecto de análisis de datos es una parte esencial cuando queremos realizar un estudio que nos facilite la toma de decisiones. Basarse en una metodología sólida como CRISP-DM es sin duda importante, aunque no es la única. Sirven como guía para llevar a cabo un proceso limpio y sin grietas que nos permita disponer de información certera en la que confiar.

Los corredores de seguros trabajan día a día con una gran cantidad de información aprovechable que, a través de una metodología adecuada y profesionales que ayuden en el diseño de las fases de un proyecto de análisis de datos, aunado al uso de herramientas tecnológicas especializadas, se convertirá en última instancia en información que aporte valor en el camino hacia la toma de decisiones informadas y la mejora continua del negocio.


¿Te gustaría recibir mensualmente artículos tan interesantes como este?
Suscríbete a nuestra Newsletter AQUÍ

Compartir: