Diferencias entre ciencia de datos e inteligencia empresarial
Data Science vs Business Intelligence, Explained
This article is a translation of the original that appears on KDnuggets:
Data Science vs Business Intelligence, Explained - KDnuggets
Diferencias entre ciencia de datos e inteligencia empresarial
Etiquetas: BI, Business Intelligence, Data
Science
Conocer las diferencias entre la
inteligencia empresarial y la ciencia de datos es más que una simple cuestión
de semántica.
![]()
Autor Stan Pugsley, Data Warehouse
y consultor de análisis
Las definiciones de los términos ciencia de datos e inteligencia
empresarial, y la relación entre ellos, ha sido durante mucho tiempo objeto de
acalorados debates. Aunque estos términos están relacionados, no comprender los
conceptos separados y distintos que subyacen en puede tener consecuencias
importantes.
Por ejemplo, en los próximos años se crearán cientos de miles de puestos
de trabajo de ciencia de datos (CD) e inteligencia empresarial (IE). El grupo
de candidatos puede parecer increíblemente pequeño o sorprendentemente grande
dependiendo de cuán relevantes y útiles se consideren las habilidades
requeridas para cada puesto. ¿Puede un experto en IE pasar con éxito a un rol
de CD? ¿CD es importante para los puestos de IE?
En 2021, los
ejecutivos de empresas evaluarán miles de millones de dólares en nuevos proyectos.
Los que reciban luz verde y los que se archiven dependerán de cómo los
ejecutivos y sus equipos entienden y definen los dos términos. Los líderes de
proyectos se apresuran a incorporar palabras de moda de la industria a sus
proyectos para seguir la última tendencia, pero ¿son estos proyectos solo un
cambio de marca de viejas ideas?
La figura 1 ofrece
una perspectiva del panorama sobre IE y CD:
Figura 1: Panorama de IE y CD.
Los fundamentos no han cambiado
La gestión y visualización de datos siguen siendo el núcleo de cualquier
esfuerzo para comprender y planificar un negocio. Estas acciones involucran
tecnologías y procesos de alto rendimiento para capturar, limpiar,
estandarizar, integrar, visualizar y proteger datos. Excel no es suficiente. Un
tablero bonito no es suficiente. Es necesario un compromiso a largo plazo a
preservar los datos como un activo, y se necesita disciplina para crear y mantener
entornos de data lake y data warehouse.
El punto crucial es que cualquier
iniciativa de CD o IE que no tenga una base de datos sólida será insostenible.
Todos los procesos que tengan su base en procesos manuales e incoherentes serán
lentos, poco confiables y requerirán muchos recursos. Eventualmente necesitan
madurar con la ayuda de profesionales de TI, o se desmoronarán por su propio
peso.
Inteligencia empresarial
Desde la década de 1980, casi todas las empresas han intentado utilizar
computadores y bases de datos para administrar y comprender sus datos históricos.
Sin embargo, la cuestión es la siguiente: después de casi 40 años, nadie lo ha
dominado realmente. Cada año, las empresas añaden o reemplazan sistemas de
software, y el departamento de TI rara vez puede mantenerse al día, por lo que
las empresas terminan priorizando proyectos constantemente para ver qué datos son
importantes y cuáles hay que ignoran (lo siento, departamento de marketing). Se
reconocerá la inteligencia empresarial por sus gráficos, paneles, diagramas de
bases de datos y proyectos de integración de datos. Es caro y frustrante, pero
indispensable.
BI has a
permanent advantage over DS because it has concrete data points; few, simple
assumptions; self-explanatory metrics; and automated processes. Furthermore, BI
will never go away. It will always be a work in progress because you will never
stop changing your business or upgrading and replacing the source systems.
IE tiene siempre una
ventaja sobre CD porque tiene puntos de datos específicos, maneja pocas
suposiciones sencillas, tiene métricas autoexplicativas y utiliza procesos automatizados.
Además, la IE nunca desaparecerá. Siempre supondrá un trabajo progresivo porque
nunca dejaremos que se detenga nuestro negocio o de actualizarse y de reemplazar
los sistemas de origen.
Ciencia de datos
Mirar los datos por el espejo retrovisor es importante y útil, pero es algo limitado y nunca nos llevará a donde deseamos ir. En algún momento, debemos mirar hacia adelante. IE debe ir acompañado de ciencia de datos.
CD es una forma complicada y sofisticada de planificación y
optimización. Algunos ejemplos son:
- Predecir en tiempo real qué producto es más probable que compre
un cliente.
- Construir una red ponderada entre micro eventos empresariales y
micro respuestas para que se puedan tomar decisiones sin la intervención
humana, y posteriormente actualizar esa red con cada resultado para que
aprenda mientras actúa.
- Pronóstico diario a nivel de SKU, con cada venta
- Identificar y predecir eventos raros, como fraudes con tarjetas
de crédito, y enviar notificaciones automáticas a clientes y / o a personal.
- Crear grupos de clientes basados en docenas de atributos y
comportamientos, y a continuación apuntarlos con mensajes personalizados.
Cuando la planificación tradicional se realiza en sesiones discretas
dirigidas por personas, las técnicas de CD deben dar como resultado pasos de
planificación y optimización que se integran en el software y se ejecutan como
parte de procesos automatizados. El modelo se entrena utilizando datos
históricos, dejando a un lado un subconjunto de datos para validar la precisión
de la predicción. Si los resultados son prometedores, el modelo se implementa y
supervisa, a menudo mediante informes de IE.
Encontrar patrocinio empresarial para proyectos de CD constituye un
desafío porque las técnicas son difíciles de explicar y visualizar. Los
proyectos son difíciles de gestionar y, a menudo, involucran datos no
estructurados o semiestructurados, supuestos complejos, modelos estadísticos,
proyectos exploratorios que llegan a callejones sin salida y visualizaciones
limitadas o confusas.
Como resultado,
los proyectos piloto pueden ser lentos al comienzo y frustrantes de mantener.
Los resultados que logremos pueden ser esporádicos debido a la imprevisibilidad
del trabajo. Predecir el futuro nunca será sencillo.
Aunque los proyectos de IE a menudo los lleva a cabo una sola persona,
los proyectos de CD requieren una amplia cooperación entre empleados que
generalmente no hablan el mismo idioma, incluidos ingenieros de datos,
estadísticos, expertos en negocios y desarrolladores de software. Las
competencias de cada puesto requieren muchos años para llegar a dominarlas. Los
científicos de datos a menudo tienen una gran experiencia en estadísticas, pero
cuentan solo con habilidades elementales de desarrollo de software y tienen una
experiencia comercial limitada. Los equipos de CD deben asociarse con
departamentos comerciales y de TI para crear soluciones verdaderamente
integradas.
Hacer que todo funcione
La conclusión es que la diferencia entre los dos términos depende de
si necesitamos mirar hacia atrás (IE) o mirar hacia adelante (ciencia de datos).
La IE recopila datos para tratar de comprender eventos en el pasado. La CD
genera datos para modelar eventos que aún no han ocurrido.
Cuando se propone un proyecto, es importante conocer las diferencias entre la práctica de ambos para aceptarlo o rechazarlo, contratar personal con las habilidades necesarias para un proyecto de IE o de CD, y diseñar una plataforma de gestión de datos que admita ambos. Debemos evitar verlos como iniciativas en que compiten entre ellas o como modas pasajeras. Tanto la ciencia de datos como la inteligencia empresarial están aquí para quedarse y serán los principales diferenciadores para las empresas que aprovechan su potencial.
Biografía: Stan Pugsley es data
warehouse y consultor de análisis en Eide Bailly Technology
Consulting con sede en Salt Lake City, UT. . También es profesor adjunto de la
Eccles School of Business de la Universidad de Utah. Puede contactar con el
autor por correo electrónico.
Original. Publicado con
el correspondiente permiso.
Enlaces relacionados:
·
The Machine Learning Puzzle, Explained
·
What’s the difference between analytics and statistics?

Comentarios
Publicar un comentario