Diferencias entre ciencia de datos e inteligencia empresarial


 

    Data Science vs Business Intelligence, Explained

This article is a translation of the original that appears on KDnuggets: 

Data Science vs Business Intelligence, Explained - KDnuggets

Diferencias entre ciencia de datos e inteligencia empresarial


 
 

Etiquetas: BIBusiness IntelligenceData Science

 

Conocer las diferencias entre la inteligencia empresarial y la ciencia de datos es más que una simple cuestión de semántica.

https://www.kdnuggets.com/aps/e-sas-21m01-2aiml.gif?ms672
Autor 
Stan Pugsley, Data Warehouse y consultor de análisis

Las definiciones de los términos ciencia de datos e inteligencia empresarial, y la relación entre ellos, ha sido durante mucho tiempo objeto de acalorados debates. Aunque estos términos están relacionados, no comprender los conceptos separados y distintos que subyacen en puede tener consecuencias importantes.

Por ejemplo, en los próximos años se crearán cientos de miles de puestos de trabajo de ciencia de datos (CD) e inteligencia empresarial (IE). El grupo de candidatos puede parecer increíblemente pequeño o sorprendentemente grande dependiendo de cuán relevantes y útiles se consideren las habilidades requeridas para cada puesto. ¿Puede un experto en IE pasar con éxito a un rol de CD? ¿CD es importante para los puestos de IE?

En 2021, los ejecutivos de empresas evaluarán miles de millones de dólares en nuevos proyectos. Los que reciban luz verde y los que se archiven dependerán de cómo los ejecutivos y sus equipos entienden y definen los dos términos. Los líderes de proyectos se apresuran a incorporar palabras de moda de la industria a sus proyectos para seguir la última tendencia, pero ¿son estos proyectos solo un cambio de marca de viejas ideas?

La figura 1 ofrece una perspectiva del panorama sobre IE y CD:



Figura 1: Panorama de IE y CD.

 

Los fundamentos no han cambiado

 
La gestión y visualización de datos siguen siendo el núcleo de cualquier esfuerzo para comprender y planificar un negocio. Estas acciones involucran tecnologías y procesos de alto rendimiento para capturar, limpiar, estandarizar, integrar, visualizar y proteger datos. Excel no es suficiente. Un tablero bonito no es suficiente. Es necesario un compromiso a largo plazo a preservar los datos como un activo, y se  necesita disciplina para crear y mantener entornos de data lake y data warehouse.

El punto crucial es que cualquier iniciativa de CD o IE que no tenga una base de datos sólida será insostenible. Todos los procesos que tengan su base en procesos manuales e incoherentes serán lentos, poco confiables y requerirán muchos recursos. Eventualmente necesitan madurar con la ayuda de profesionales de TI, o se desmoronarán por su propio peso.

 

Inteligencia empresarial

Desde la década de 1980, casi todas las empresas han intentado utilizar computadores y bases de datos para administrar y comprender sus datos históricos. Sin embargo, la cuestión es la siguiente: después de casi 40 años, nadie lo ha dominado realmente. Cada año, las empresas añaden o reemplazan sistemas de software, y el departamento de TI rara vez puede mantenerse al día, por lo que las empresas terminan priorizando proyectos constantemente para ver qué datos son importantes y cuáles hay que ignoran (lo siento, departamento de marketing). Se reconocerá la inteligencia empresarial por sus gráficos, paneles, diagramas de bases de datos y proyectos de integración de datos. Es caro y frustrante, pero indispensable.

BI has a permanent advantage over DS because it has concrete data points; few, simple assumptions; self-explanatory metrics; and automated processes. Furthermore, BI will never go away. It will always be a work in progress because you will never stop changing your business or upgrading and replacing the source systems. IE tiene siempre una ventaja sobre CD porque tiene puntos de datos específicos, maneja pocas suposiciones sencillas, tiene métricas autoexplicativas y utiliza procesos automatizados. Además, la IE nunca desaparecerá. Siempre supondrá un trabajo progresivo porque nunca dejaremos que se detenga nuestro negocio o de actualizarse y de reemplazar los sistemas de origen.

 

Ciencia de datos

 Mirar los datos por el espejo retrovisor es importante y útil, pero es algo limitado y nunca nos llevará a donde deseamos ir. En algún momento, debemos mirar hacia adelante. IE debe ir acompañado de ciencia de datos.

CD es una forma complicada y sofisticada de planificación y optimización. Algunos ejemplos son:

  • Predecir en tiempo real qué producto es más probable que compre un cliente.
  • Construir una red ponderada entre micro eventos empresariales y micro respuestas para que se puedan tomar decisiones sin la intervención humana, y posteriormente actualizar esa red con cada resultado para que aprenda mientras actúa.
  • Pronóstico diario a nivel de SKU, con cada venta
  • Identificar y predecir eventos raros, como fraudes con tarjetas de crédito, y enviar notificaciones automáticas a clientes y / o a personal.
  • Crear grupos de clientes basados en docenas de atributos y comportamientos, y a continuación apuntarlos con mensajes personalizados.

 

Cuando la planificación tradicional se realiza en sesiones discretas dirigidas por personas, las técnicas de CD deben dar como resultado pasos de planificación y optimización que se integran en el software y se ejecutan como parte de procesos automatizados. El modelo se entrena utilizando datos históricos, dejando a un lado un subconjunto de datos para validar la precisión de la predicción. Si los resultados son prometedores, el modelo se implementa y supervisa, a menudo mediante informes de IE.

Encontrar patrocinio empresarial para proyectos de CD constituye un desafío porque las técnicas son difíciles de explicar y visualizar. Los proyectos son difíciles de gestionar y, a menudo, involucran datos no estructurados o semiestructurados, supuestos complejos, modelos estadísticos, proyectos exploratorios que llegan a callejones sin salida y visualizaciones limitadas o confusas.

Como resultado, los proyectos piloto pueden ser lentos al comienzo y frustrantes de mantener. Los resultados que logremos pueden ser esporádicos debido a la imprevisibilidad del trabajo. Predecir el futuro nunca será sencillo.

Aunque los proyectos de IE a menudo los lleva a cabo una sola persona, los proyectos de CD requieren una amplia cooperación entre empleados que generalmente no hablan el mismo idioma, incluidos ingenieros de datos, estadísticos, expertos en negocios y desarrolladores de software. Las competencias de cada puesto requieren muchos años para llegar a dominarlas. Los científicos de datos a menudo tienen una gran experiencia en estadísticas, pero cuentan solo con habilidades elementales de desarrollo de software y tienen una experiencia comercial limitada. Los equipos de CD deben asociarse con departamentos comerciales y de TI para crear soluciones verdaderamente integradas.

 

Hacer que todo funcione

La conclusión es que la diferencia entre los dos términos depende de si necesitamos mirar hacia atrás (IE) o mirar hacia adelante (ciencia de datos). La IE recopila datos para tratar de comprender eventos en el pasado. La CD genera datos para modelar eventos que aún no han ocurrido.

Cuando se propone un proyecto, es importante conocer las diferencias entre la práctica de ambos para aceptarlo o rechazarlo, contratar personal con las habilidades necesarias para un proyecto de IE o de CD, y diseñar una plataforma de gestión de datos que admita ambos. Debemos evitar verlos como iniciativas en que compiten entre ellas o como modas pasajeras. Tanto la ciencia de datos como la inteligencia empresarial están aquí para quedarse y serán los principales diferenciadores para las empresas que aprovechan su potencial.

 
Biografía: 
Stan Pugsley es data warehouse y consultor de análisis en Eide Bailly Technology Consulting con sede en Salt Lake City, UT. . También es profesor adjunto de la Eccles School of Business de la Universidad de Utah. Puede contactar con el autor por correo electrónico.

Original. Publicado con el correspondiente permiso.

Enlaces relacionados:

·         The Machine Learning Puzzle, Explained

·         What is Data Science?

·         What’s the difference between analytics and statistics?

 

Comentarios

Entradas populares de este blog

Kubernetes versus Amazon ECS para científicos de datos

Conferencia virtual gratuita: la ciencia de la inteligencia artificial empresarial

Sistema de recomendación basado en aprendizaje profundo