Los datos son más importantes que nunca, pero la mayoría de las organizaciones siguen teniendo problemas comunes: se centran más en la infraestructura de datos que en los productos de datos; los datos suelen crearse teniendo en cuenta las necesidades de un departamento en particular, pero poco pensados para el uso final; carecen de un «lenguaje de datos» común en el que cada departamento codifique y clasifique con su propio sistema; y se centran cada vez más en los datos externos, pero tienen pocos sistemas de control de calidad. Al centrarse en la gestión de la «cadena de suministro de datos», las empresas pueden abordar estas y otras cuestiones. Al igual que en las cadenas de suministro físicas, las empresas deberían pensar de forma sistemática, centrarse en los productos finales, definir los estándares y las medidas, introducir controles de calidad y refinar constantemente su enfoque en todas las fases de la recopilación y el análisis de los datos.

•••

La gestión de datos ha atormentado a las grandes empresas durante décadas. Casi todas las empresas gastan mucho en ellopero los resultados me parecen insatisfactorios. Si bien el problema no parece estar empeorando, resolverlo es cada vez más urgente, ya que los directivos y las empresas se esfuerzan por centrarse más en los datos, aprovechar la analítica avanzada y la inteligencia artificial y competir con los datos. En este artículo analizaremos un enfoque eficaz de la gestión de datos desde la perspectiva de»productos de datos» y «cadenas de suministro de datos».

La mayoría de las empresas tienen problemas de gestión de datos comunes pero importantes.

En primer lugar, las empresas se han centrado en las capacidades técnicas de la gestión de datos, que están controladas por la función de TI y son necesarias para adquirir, almacenar y mover datos. No es tarea fácil: construir «tuberías» técnicas es un trabajo difícil. Pero al hacerlo, se han centrado más en la infraestructura y mucho menos en los resultados: los productos de datos que se utilizan para tomar decisiones, diferenciar los productos y servicios y satisfacer a los clientes.

En segundo lugar, los datos se crean en diferentes partes de la organización para satisfacer las necesidades de los distintos departamentos, no para que otros los utilicen posteriormente en los productos de datos, las decisiones empresariales o los procesos. Compare eso con un producto físico, como un coche, en el que los componentes como el chasis y el motor de arranque se diseñan pensando en el producto final.

En tercer lugar,la mayoría de las organizaciones carecen de un lenguaje de datos común. Los datos son sutiles y matizados, y tienen diferentes significados para diferentes personas en diferentes contextos. Para agravar esta situación, algunos departamentos, que se hacen cargo de «sus datos», pueden mostrarse reacios a compartirlos. O si bien están dispuestos a compartir, no tendrán tiempo para explicar estos matices para que otros puedan utilizarlos de forma eficaz. Esto lleva a otros departamentos a crear sus propias bases de datos «casi redundantes», lo que aumenta la confusión general.

Por último, las empresas se interesan cada vez más por lo que ocurre fuera de sus paredes y utilizan datos externos para responder a una variedad de preguntas. Sin embargo, los datos externos prácticamente no se gestionan y hay poca cualificación de los proveedores o evaluación de la calidad de los datos.

La gestión de la cadena de suministro de datos, con los productos de datos como resultado final del proceso, puede ayudar a abordar cada uno de estos problemas. Hace el mismo hincapié en todas las fases de la gestión de datos, desde la recopilación hasta la organización y el consumo de los productos de datos. Es una forma de equilibrar las ventajas de los datos comunes con las de los datos únicos y personalizados en los productos, y se adapta por igual a los datos internos y externos. Relativamente pocas empresas emplean la gestión de la cadena de suministro de datos, pero las que sí lo hacen tienden a obtener mejores resultados.

Gestión de procesos y proveedores para productos de datos

Las empresas siempre han creado productos de datos en forma de estados financieros, informes para los reguladores, etc. Aun así, la gama y la importancia de estos productos están aumentando. Para muchos, el objetivo es integrar modelos analíticos y derivados de la IA en los productos que sirvan a clientes internos y externos. De Morgan StanleyPróxima mejor acción, de LinkedIn Personas que tal vez conozca, las numerosas ofertas de búsqueda de Google y las de MasterCard Pulso de gasto yLocalizador de empresas son buenos ejemplos. Con los problemas citados anteriormente en pantalla completa, «discutir» los datos lleva mucho más tiempo que crear el modelo y aun así no resuelve todos los problemas.

Afortunadamente, hay una forma mejor de obtener datos de alta calidad. Se basa en las técnicas de gestión de procesos y proveedores utilizadas por los fabricantes de productos físicos. En concreto, los fabricantes se adentran profundamente en sus cadenas de suministro para aclarar sus requisitos, cualificar a los proveedores, insistir en que los proveedores midan la calidad y realizar las mejoras necesarias en el origen o los problemas. Esto les permite ensamblar los componentes en productos terminados con un mínimo de «problemas físicos con el producto», lo que mejora la calidad y reduce los costes.

Una organización que emplea la gestión de la calidad de los proveedores en su cadena de suministro de datos esAltria, el proveedor estadounidense de tabaco y productos antihumo. Altria depende de los datos de puntos de venta de más de 100 000 tiendas de conveniencia al día para completar sus informes y análisis de mercado. Un equipo que depende de Kirby Forlin, vicepresidente de análisis avanzado, administra esta base. Los requisitos de datos se detallan en los contratos y el equipo tiene como objetivo ayudar a las tiendas a cumplirlos. Para empezar, Altria se concentró en sus requisitos más básicos. La calidad era mala, y solo el 58% de las solicitudes diarias cumplían con los requisitos. Pero el equipo de Altria trabajó con paciencia y mejoró la calidad al 98% en tres años. A medida que la puntuación de la calidad básica mejoró, el equipo de Altria añadió sus requisitos más avanzados a la mezcla. Como señaló Forlin: «Se trata de un trabajo en progreso. La evidencia de que podemos confiar cada vez más en los datos nos ahorra mucho trabajo en nuestra práctica de análisis y genera confianza en nuestro trabajo».

Pasos hacia una cadena de suministro de datos

La cadena de suministro de datosse puede establecer dentro de una empresa siguiendo algunos de los mismos pasos utilizados engestión de procesos y calidad para las cadenas de suministro físicas:

  1. Establecer las responsabilidades de gestión. Como paso 1a, el director de datos o el director de producto deberían nombrar a un «director de la cadena de suministro de datos» de su personal para coordinar el esfuerzo y contratar a las «partes responsables» de cada departamento (incluidas las fuentes de datos externas) de la cadena de suministro. El paso 1b consiste en poner en primer plano los problemas relacionados con el intercambio y la propiedad de los datos. Descubrimos que la mayoría de los problemas desaparecen, ya que pocos directivos desean adoptar una postura firme en contra del intercambio de datos delante de sus compañeros.
  2. Identifique y documente los datos y los requisitos de coste, tiempo y calidad asociados necesarios para crear y mantener los productos de datos.
  3. Describa la cadena de suministro. Desarrolle un diagrama de flujo que describa los puntos de creación de los datos o las fuentes originales de los datos y las medidas adoptadas para mover, enriquecer y analizar los datos para utilizarlos en los productos de datos.
  4. Defina y establezca las medidas. En general, la idea es implementar medidas que indiquen si se cumplen los requisitos. Comience por la precisión de los datos y el tiempo transcurrido desde la creación de los datos hasta su incorporación a un producto de datos. Las medidas variarán en función de la cadena de suministro de cada producto de datos.
  5. Establezca el control del proceso y evalúe el cumplimiento de los requisitos. Utilice las medidas del paso cuatro para controlar el proceso y determinar qué tan bien se cumplen los requisitos del segundo paso e identificar las brechas.
  6. Investigue la cadena de suministro para identificar las mejoras necesarias, en general y para determinados productos de datos. Determine dónde se originan las brechas descubiertas en el paso cinco en el diagrama de flujo del tercer paso.
  7. Realice mejoras y supervise continuamente. Identifique y elimine las causas fundamentales de las brechas identificadas en el sexto paso y vuelva a las medidas anteriores si es necesario. Supervise continuamente los datos de entrada y los productos de datos, buscando mejorar los productos y los nuevos datos y las mejores fuentes que se necesitan para hacerlo.
  8. Fuentes de datos «cualificar». Las empresas seguirán contratando a un número cada vez mayor de proveedores de datos externos y es útil identificar a los que proporcionan datos de alta calidad de forma constante. Las auditorías de sus programas de calidad de datos proporcionan los medios para «calificar» a los que sí lo hacen e identificar los puntos débiles de los que no.

Key Bank, unLos 20 principales bancos de EE. UU. en cuanto al tamaño de los activos, utiliza un concepto amplio de cadena de suministro de datos para estructurar sus iniciativas de gestión de datos. Divide su proceso en las áreas de «capturar/organizar/consumir» e intenta mejorar la eficiencia y la eficacia en cada área. Hace poco trasladó gran parte de su almacenamiento de datos y análisis a la nube y descubrió importantes mejoras en la flexibilidad y la velocidad en toda la cadena de suministro. Sus actividades de consumo se centraban históricamente en las funciones clásicas de inteligencia empresarial, pero ahora también tiene una sólida función de ciencia de datos.

Eso requirió un cambio en la cadena de suministro hacia una mayor virtualización de los datos y la capacidad de crear vistas de los datos que abarcaran diferentes mercados de datos y que incorporaran también datos externos. El banco ha podido utilizar su cadena de suministro de datos para desarrollar rápidamente nuevos productos bancarios que dependan en gran medida de los datos. Por ejemplo, fue uno de los principales prestamistas de préstamos del Plan de Protección de la Nómina de los EE. UU., y también creó recientemente un banco digital nacional para médicos. Mike Onders, el director de datos del banco, es en efecto el director de la cadena de suministro de datos. Su personal y él han evaluado la capacidad de la cadena de suministro de datos del banco para suministrar una variedad de productos de datos necesarios.

Instamos a todas las empresas a gestionar de forma agresiva sus cadenas de suministro de datos más importantes. Los datos son un activo tan importante para las empresas como cualquier otro tipo, y los productos de datos son cada vez más importantes que los físicos. La misma idea que ha mejorado las cadenas de suministro físicas durante décadas está resultando igual de valiosa para los datos.