Pronósticos en Excel

El Papel de la Estadística Dentro de los Modelos de Big Data

Tanto se ha hablado de Big Data en los últimos años que vale la pena ir un paso atrás para hablar acerca de las bases del mismo, y es que como dice el adagio popular: “Primero fué el uno que el dos”, por eso antes de referirse al Big Data vale la pena revisar cómo la estadística soporta ésta nueva disciplina que está en auge en todas las industrias.

La estadística, como conjunto de métodos y principios para describir el comportamiento de un fenómeno, aporta toda su potencial a las dos grandes ramas del Big Data: El Business Intelligence y los modelos avanzados de analítica, con los cuales se realizan pronósticos y proyecciones. En otro aparte de este blog hablaremos un poco más sobre las diferencias entre ellos.

Si partimos del hecho de que los datos son la representación o cuantificación de una situación o un fenómeno, como por ejemplo la cantidad de productos exportados por un país, podríamos decir que la estadística descriptiva es la base del Business Intelligence, reflejando el comportamiento de dicho fenómeno basado en sus datos históricos, y respondiendo básicamente a las preguntas de ¿qué pasó?, ¿cuándo? y ¿quién?. Para responder a éstas preguntas la estadística descriptiva se basa en tablas de resultados y distintos tipos de gráficos en donde los más comunes son los histogramas, diagramas circulares, líneas de tendencia, y gráficos de dispersión para mostrar la relación entre dos variables numéricas, pero siempre basados en realidades de lo que ya ocurrió.

A partir de dichos datos históricos se nutren los modelos avanzados de analítica. Dentro de éstos, los modelos más versátiles son las series de tiempo o series cronológicas, que tienen aplicabilidad a casi cualquier variable de tipo numérico que se quiera predecir y en donde exista un registro histórico amplio. Éste tipo de modelos, aparte de su simplicidad, básicamente ayudan a determinar, en buena medida, cuál será el comportamiento de la variable analizada, como por ejemplo las ventas.

La estadística inferencial y las probabilidades también juegan un papel importante en los modelos avanzados de analítica ya que además de anticipar un resultado o comportamiento, determina una probabilidad de ocurrencia. Dentro de éste tipo de modelos los más comunes son los árboles de decisión, los cuales predicen la probabilidad de un resultado con base en distintos escenarios paralelos. Normalmente los tipos de preguntas que responden estos modelos son de tipo ¿qué pasa si..?, y podríamos ilustra como un ejemplo aquellos modelos que ayudan a predecir o determinar la probabilidad de fuga de un cliente con base en ciertas características o comportamientos, por ejemplo las probabilidades de fuga entre quienes han presentado una queja en determinado momento, o entre quienes han recibido ofertas de empresas competidoras.

Ejemplos de otros modelos avanzados de analítica podemos encontrar en cantidades, pero los datos, cualquiera que sea su volumen, siempre requerirán de reglas y procedimientos estadísticos para ser descritos, entendidos, analizados y predecidos. Es por eso que detrás de cualquier modelo de Big Data, por complejo que sea, siempre tendrá detrás un principio básico de estadística que lo soporta.

WhatsApp chat