La mayoría de las empresas se esfuerzan por aprovechar el enorme potencial de sus datos. Por lo general, lanzan programas masivos que intentan satisfacer las necesidades de todos los usuarios finales de datos o hacen que los equipos de desarrollo de aplicaciones individuales configuren flujos de datos personalizados que no se pueden reutilizar fácilmente. En cambio, las empresas tienen que averiguar cómo elaborar estrategias de datos que generen valor a corto plazo y, al mismo tiempo, sentar las bases para el uso futuro de los datos.
Las empresas de éxito lo hacen tratando los datos como un producto comercial. Cuando una empresa desarrolla un producto, trata de maximizar las ventas abordando con él las necesidades del mayor número de tipos de clientes posible, a menudo mediante la creación de una oferta estándar que se puede personalizar para diferentes usuarios. Un producto de datos funciona de manera similar. Ofrece un conjunto de datos de alta calidad y fácil de usar que las personas de una organización pueden aplicar a diversos desafíos empresariales. Podría, por ejemplo, ofrecer una visión de 360 grados de los clientes, los empleados o un canal.
Como tienen muchas aplicaciones, los productos de datos pueden generar beneficios impresionantes. El producto de datos de clientes de un banco grande, por ejemplo, tiene casi 60 casos de uso, y esas aplicaciones generan 60 millones de dólares en ingresos incrementales y eliminan 40 millones de dólares en pérdidas al año.
•••
Resumen de la idea
El problema
Si bien los datos ofrecen enormes oportunidades, las estrategias de la mayoría de las empresas para hacerlas realidad no son eficaces.
Por qué ocurre
Con demasiada frecuencia, los esfuerzos de las empresas en materia de datos no logran sentar las bases para el uso futuro de los datos. Los equipos individuales crean un flujo de datos personalizado para cada aplicación que no se puede reutilizar fácilmente.
La solución
Cree productos de datos estándar que se puedan personalizar para que se adapten a las necesidades de los distintos tipos de usuarios y muchas aplicaciones. Los productos los pueden gestionar equipos dedicados dentro de las unidades de negocio, con el apoyo de una función central que coordina y estandariza el diseño.
Aunque todas las empresas reconocen el[el poder de los datos](https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/the-data-driven-enterprise-of-2025), la mayoría se esfuerza por aprovechar todo su potencial. El problema es que las inversiones en datos deben ofrecer valor a corto plazo y, al mismo tiempo, sentar las bases para un rápido desarrollo de los usos futuros, mientras las tecnologías de datos evolucionan de formas impredecibles, surgen nuevos tipos de datos y el volumen de datos sigue aumentando. Las experiencias de dos empresas globales ilustran lo ineficaces que son las estrategias de datos predominantes en la actualidad a la hora de gestionar esos desafíos. El primero, un gran banco de Asia y el Pacífico, adoptó el enfoque «a lo grande», suponiendo que pudiera adaptarse a las necesidades de todos los equipos de desarrollo de análisis y usuarios finales de datos de una sola vez. Lanzó un enorme programa para crear canalizaciones a fin de extraer todos los datos de sus sistemas, limpiarlos y agregarlos en un lago de datos en la nube, sin tardar mucho tiempo por adelantado en alinear sus esfuerzos con los casos de uso empresarial. Tras dedicar casi tres años a crear una nueva plataforma, el banco descubrió que solo algunos usuarios, como los que buscaban datos históricos sin procesar para analizarlos ad hoc, podían utilizarlos fácilmente. Además, se habían pasado por alto las necesidades arquitectónicas críticas de muchas aplicaciones potenciales, como las fuentes de datos en tiempo real para ofertas personalizadas para los clientes. Como resultado, el programa no generó mucho valor para la empresa. La segunda empresa, un gran banco norteamericano, hacía que los equipos individuales utilizaran las fuentes y sistemas de datos existentes por su cuenta y, a continuación, reunieran cualquier tecnología adicional que sus casos de uso empresarial necesitaran. Los equipos crearon algo de valor al resolver desafíos como mejorar la segmentación de los clientes para los canales digitales y permitir una notificación de riesgos eficiente. Pero el resultado general fue un lío de canalizaciones de datos personalizadas que no podían reutilizarse fácilmente. Todos los equipos tenían que empezar de cero, lo que hacía que los esfuerzos de transformación digital fueran tremendamente costosos y lentos. Entonces, si ni una estrategia de datos monolítica ni popular funciona, ¿cuál es el enfoque correcto? Descubrimos que las empresas tienen más éxito cuando tratan los datos como un producto. Cuando una empresa desarrolla un producto comercial, normalmente trata de crear una oferta que pueda satisfacer las necesidades del mayor número posible de usuarios para maximizar las ventas. A menudo, eso significa desarrollar un producto base que se pueda personalizar para diferentes usuarios. Los fabricantes de automóviles lo hacen permitiendo a los clientes añadir una variedad de opciones especiales (tapicería de piel, vidrios polarizados, dispositivos antirrobo, etc.) a los modelos estándar. Del mismo modo, las aplicaciones digitales suelen permitir a los usuarios personalizar sus paneles, incluida la personalización del diseño, las combinaciones de colores y el contenido que se muestra, u ofrecen diferentes planes y estructuras de precios para las diferentes necesidades de los usuarios. Las empresas que tratan los datos como un producto pueden reducir hasta un 90% el tiempo que se tarda en implementarlos en nuevos casos de uso. Con el tiempo, las empresas mejoran sus productos añadiendo nuevas funciones (modificaciones en el motor que aumentan el ahorro de combustible del coche o nuevas funciones en una aplicación) e introducen nuevas ofertas en respuesta a los comentarios de los usuarios, las evaluaciones del rendimiento y los cambios en el mercado. Mientras tanto, las empresas buscan aumentar la eficiencia de la producción. Siempre que es posible, reutilizan los procesos, la maquinaria y los componentes existentes. (Los fabricantes de automóviles utilizan un chasis común en coches muy diferentes, por ejemplo, y los desarrolladores de aplicaciones reutilizan bloques de código). Tratar los datos prácticamente de la misma manera ayuda a las empresas a equilibrar la entrega de valor con los de hoy y a allanar el camino para sacarles más valor mañana rápidamente. En nuestro trabajo, hemos visto que las empresas que tratan los datos como un producto pueden reducir el tiempo que se tarda en implementarlos en nuevos casos de uso hasta un 90%, reducir sus costes totales de propiedad (tecnología, desarrollo y mantenimiento) hasta un 30% y reducir su carga de riesgo y gobierno de los datos. En las páginas siguientes describiremos qué constituye un producto de datos y describiremos las mejores prácticas para crear uno. ## ¿Qué es un producto de datos? Un producto de datos ofrece un conjunto de datos de alta calidad y listos para usar a los que las personas de una organización pueden acceder fácilmente y aplicarlos a diferentes desafíos empresariales. Podría, por ejemplo, ofrecer una visión integral de los clientes, incluidos todos los detalles que las unidades de negocio y los sistemas de la empresa recopilan sobre ellos: comportamiento de compra en línea y en la tienda, información demográfica, métodos de pago, sus interacciones con el servicio de atención al cliente y mucho más. O podría ofrecer vistas de 360 grados de los empleados o de un canal, como las sucursales de un banco. Otro producto podría permitir «gemelos digitales», que utilizan los datos para replicar virtualmente el funcionamiento de los activos o procesos del mundo real, como las piezas fundamentales de la maquinaria o toda la línea de producción de una fábrica. Como tienen muchas aplicaciones, los productos de datos pueden generar beneficios impresionantes. En un gran banco nacional, un producto de datos de clientes ha permitido casi 60 casos de uso, que van desde la puntuación del riesgo crediticio en tiempo real hasta chatbots que responden a las preguntas de los clientes, en varios canales. Esas aplicaciones ya generan 60 millones de dólares en ingresos incrementales y eliminan 40 millones de dólares en pérdidas al año. Y a medida que el producto se aplique a nuevos casos de uso, su impacto seguirá aumentando. Los productos de datos se encuentran en la parte superior de los almacenes de datos operativos existentes, como almacenes o lagos. Los equipos que los utilizan no tienen que perder tiempo buscando datos, procesándolos en el formato correcto y creando conjuntos de datos y canalizaciones de datos a medida (lo que, en última instancia, crea un lío arquitectónico y desafíos de gobierno). ![Traditional Data Consumption Versus the Data Product Model. This diagram shows how data flows from its initial sources to its eventual use cases in both a traditional corporate approach and in a data product approach. In the traditional approach, individual use case teams identify the data they need from source systems and create data sets and feeds only for their particular solutions. Data pipelines designed for batch and real-time delivery are fragmented and duplicative. Data for each domain, such as the customer, is inefficiently reworked again and again. Data quality, definitions, and formats vary. Different technologies are employed for each use case, adding expense and complexity. The result is a great deal of replicated work and a messy data architecture that’s difficult to maintain and use for new solutions. The data product approach is more modular. Teams build solutions with standardized data products, each of which focuses on a single domain, such as customers, vendors, branches, or employees. The teams wire technologies together following five reusable consumption archetype patterns. These are direct to digital apps, advanced analytics, reporting, external data sharing, and discovery and exploration. That reduces work, produces a far simpler enterprise data architecture, and decreases the time it takes to realize value.](https://hbr.org/resources/images/article_assets/2022/05/R2204G_DESAI_CONSUMPTION_610.png) [Ver más gráficos de HBR en Datos y imágenes](https://www.hbr.org/data-visuals) Cada producto de datos apoya a los «consumidores» de datos con diferentes necesidades, de la misma manera que un producto de software ayuda a los usuarios que trabajan en ordenadores con diferentes sistemas operativos. Estos consumidores son sistemas, no personas, y nuestro trabajo sugiere que las organizaciones suelen tener cinco tipos. Los llamamos «arquetipos de consumo» porque describen para qué se utilizan los datos. Incluyen: ### 1. Aplicaciones digitales. Necesitan datos específicos que se limpien, se almacenen en el formato necesario (tal vez como mensajes individuales en una transmisión de eventos o una tabla de registros en un data mart (un área de almacenamiento de datos orientada a un tema, función empresarial o equipo) y que se entreguen con una frecuencia determinada. Por ejemplo, una aplicación digital que rastrea la ubicación de un vehículo necesitará acceder en tiempo real a las transmisiones de eventos de los datos del GPS o de los sensores. Una aplicación de marketing diseñada para encontrar las tendencias en el comportamiento de navegación de los clientes necesitará acceder a grandes volúmenes de datos de registro web bajo demanda (a menudo denominados datos «por lotes») de un centro de datos. ### 2. Sistemas de análisis avanzados. También necesitan que los datos se limpien y entreguen con una frecuencia determinada, pero deben diseñarse para permitir[sistemas de aprendizaje automático e IA](https://www.mckinsey.com/business-functions/mckinsey-analytics/our-insights/global-survey-the-state-of-ai-in-2021), como motores de simulación y optimización, para procesarlo. ### 3. Sistemas de informes. Necesitan datos altamente gobernados (datos con definiciones claras que se gestionen de cerca para garantizar la calidad, la seguridad y los cambios) que se agreguen a un nivel básico y se entreguen de forma auditada para su uso en paneles o actividades reglamentarias y de cumplimiento. Por lo general, los datos se entregan en lotes, pero las empresas optan cada vez más por modelos de autoservicio y actualizaciones intradía que incorporan feeds en tiempo real. ### 4. Sandboxes Discovery. Permiten el análisis exploratorio ad hoc de una combinación de datos brutos y agregados. Los científicos e ingenieros de datos los utilizan con frecuencia para ahondar en los datos y descubrir nuevos posibles casos de uso. ### 5. Sistemas externos de intercambio de datos. Deben cumplir políticas y acuerdos estrictos sobre la ubicación de los datos y la forma en que se gestionan y protegen. Los bancos utilizan estos sistemas para compartir información sobre el fraude entre sí, por ejemplo, y los minoristas para compartir datos con los proveedores con la esperanza de mejorar las cadenas de suministro. Cada arquetipo de consumo requiere diferentes tecnologías para almacenar, procesar y entregar los datos y exige que esas tecnologías se ensamblen siguiendo un patrón específico. Este patrón es básicamente un plan arquitectónico de cómo deben encajar las tecnologías necesarias. Por ejemplo, lo más probable es que un patrón para un entorno de pruebas incluya tecnologías para configurar un entorno de autoservicio multiusuario al que puedan acceder los ingenieros de datos de toda la empresa. El patrón de un sistema de análisis avanzado que utiliza fuentes de datos en tiempo real puede incluir tecnologías para procesar grandes volúmenes de datos no estructurados. Como un ladrillo de Lego, un producto de datos diseñado para soportar uno o más de estos arquetipos de consumo se puede instalar rápidamente en cualquier número de aplicaciones empresariales. ![](https://hbr.org/resources/images/article_assets/2022/05/R2204G_CAMPBELL_A-scaled.jpg) _Harry Campbell_ Pensemos en una empresa minera que creó un producto de datos que proporcionaba datos GPS en directo de la ubicación de los camiones de transporte de mineral. Se diseñó para admitir todos los arquetipos, excepto el intercambio externo de datos, en su primer caso de uso, lo que mejoró los rendimientos del procesamiento de minerales. La empresa pronto descubrió que el producto tenía usos mucho más allá de eso. Cuando estuvo disponible más ampliamente en la organización, varios empleados emprendedores la aprovecharon inmediatamente para eliminar los cuellos de botella en el sistema de transporte de la mina. En solo tres días, crearon un prototipo de herramienta de apoyo a la
toma de decisiones sobre rutas de camiones que reducía el tiempo de espera y las emisiones de carbono. Si hubieran tenido que diseñar los datos desde cero, habrían llevado casi tres meses. A medida que se corría la voz, los empleados interesados en otros temas relacionados con los camiones, como la seguridad, el mantenimiento y los horarios de los conductores, aprovecharon los datos para encontrar respuestas a preguntas espinosas y crear soluciones generadoras de ingresos que antes hubieran sido imposibles. ## Gestión y desarrollo de productos de datos Ya vendan sedanes, software o zapatillas, la mayoría de las empresas tienen directores de producto internos que se dedican a investigar las necesidades del mercado, desarrollar hojas de ruta de las capacidades de los productos y diseñar y comercializar los productos de forma rentable. Del mismo modo, cada producto de datos debe tener un director de producto designado que se encargue de formar un equipo de expertos para crearlo, apoyarlo y mejorarlo con el tiempo. Tanto el gerente como los expertos deben formar parte de un grupo de utilidades de datos que se encuentre dentro de una unidad de negocio. Por lo general, estos grupos incluyen ingenieros de datos, arquitectos de datos, modeladores de datos, ingenieros de plataformas de datos e ingenieros de confiabilidad de sitios. Al integrarlos en las unidades de negocio, los equipos de productos de datos tienen fácil acceso tanto a los expertos empresariales en la materia como a la asistencia operativa, legal, legal y de riesgos que necesitan para desarrollar productos de datos útiles y que cumplan con las normas. También conecta directamente a los equipos con los comentarios de los usuarios, lo que les ayuda a seguir mejorando sus productos e identificar nuevos usos. La primera versión del producto de datos de clientes en el banco nacional, por ejemplo, se centró en los perfiles demográficos de los clientes y en la información sobre las transacciones. Las versiones posteriores incluyeron datos sobre las interacciones con los clientes y los clientes potenciales, lo que atrajo a un número significativamente mayor de usuarios de datos y ayudó a los equipos a desarrollar otras aplicaciones. El ahorro de costes y el aumento de los ingresos logrados por los primeros usos del producto financiaron las siguientes fases, creando un modelo de negocio sostenible. Una empresa también necesita un centro de excelencia para apoyar a los equipos de productos y determinar los estándares y las mejores prácticas para crear productos de datos en toda la organización. Por ejemplo, el centro debe definir la forma en que los equipos documentarán la procedencia de los datos, auditarán el uso de los datos y medirán la calidad de los datos, y debería diseñar los patrones de arquetipos de consumo para que los utilicen los equipos de productos de datos. Este enfoque puede eliminar la complejidad y el despilfarro. Además, el centro puede ser un recurso para talentos especializados o expertos en datos cuando la demanda de ellos aumente en los grupos de servicios públicos o los equipos de casos de uso empresarial. Por ejemplo, en un proveedor de telecomunicaciones con el que trabajamos, los expertos en visión artificial, que escasean pero a menudo tienen demanda, se sientan en el centro central y son desplegados en las unidades de negocio si así lo solicitan. Como un ladrillo de Lego, un producto de datos diseñado para soportar uno o más arquetipos de consumo se puede instalar rápidamente en cualquier número de aplicaciones empresariales. Si bien la mayoría de las empresas ya cuentan con algunos, si no todos, del talento necesario para crear sus grupos de servicios públicos y centros de excelencia, muchas necesitarán ampliar su cartera de expertos, especialmente ingenieros de datos que pueden limpiar, transformar y agregar datos para su análisis y exploración. Esto fue especialmente cierto para la empresa minera, que necesitaba aumentar su personal de ingeniería de datos de tres a 40 personas. Para cubrir ese gran vacío, sus líderes adoptaron un enfoque gradual. Contrataron a contratistas para que realizaran su trabajo de inmediato y, luego, se embarcaron en esfuerzos de contratación de gran alcance: organizaron eventos de networking, publicaron artículos en LinkedIn, mejoraron las habilidades de los ingenieros de software que ya formaban parte de la plantilla y desarrollaron programas de pasantías en colegios y universidades locales. Para mejorar la retención, crearon un gremio de ingenieros de datos que les ayudó a desarrollar sus habilidades y a compartir las mejores prácticas. La empresa también elaboró planes individualizados para los ingenieros de datos que garantizaban que esos profesionales tuvieran una trayectoria de crecimiento clara tras unirse a la empresa. ## Seguimiento del rendimiento y la calidad Para comprobar si los productos comerciales tienen éxito, las organizaciones analizan barómetros como las ventas, la retención, el compromiso, la satisfacción y la rentabilidad de los clientes. Los productos de datos se pueden evaluar con métricas proporcionales, como el número de usuarios activos al mes, el número de aplicaciones en la empresa, la satisfacción de los usuarios y el retorno de la inversión en los casos de uso. La empresa de telecomunicaciones hizo un seguimiento del impacto de su primer producto de datos, que proporcionaba datos exhaustivos sobre los equipos críticos de redes móviles, en 150 casos de uso. Incluían sistemas de decisiones de inversión, sistemas de planificación de escenarios y motores de optimización de redes. En total, generarán cientos de millones de dólares en ahorros de costes y nuevos ingresos en tres años. La empresa estima que, durante los primeros 10 años, los casos de uso tendrán un impacto financiero acumulado de 5000 millones de dólares, lo que representará una rentabilidad muchas veces superior a su inversión inicial. Y así como los fabricantes utilizan de forma rutinaria las pruebas de control de calidad o las inspecciones de las líneas de producción para asegurarse de que sus productos funcionan según lo prometido, los directores de productos de datos pueden garantizar la calidad de los datos de sus ofertas. Para ello, deben gestionar estrictamente las definiciones de los datos (especificando, por ejemplo, si los datos de los clientes incluyen solo a los clientes activos o también a los clientes anteriores y posibles), la disponibilidad y los controles de acceso. También deben trabajar en estrecha colaboración con los empleados propietarios de los sistemas de fuentes de datos o que son responsables de la integridad de los datos. (Estos últimos se denominan a veces «administradores de datos»). La calidad puede verse afectada, por ejemplo, cuando se capturan los mismos datos de diferentes maneras en diferentes sistemas, lo que resulta en entradas duplicadas. Era un riesgo con el producto de datos de clientes del banco nacional. Así que su director de producto trabajó con los administradores de los distintos repositorios y aplicaciones de datos de clientes de la empresa para establecer un identificador único para cada cliente. Eso permitió que los datos del cliente se integraran sin problemas en cualquier caso de uso o con cualquier producto de datos relacionado. El director de producto también se asoció con el centro de excelencia para desarrollar los estándares y las políticas[que rige los datos de los clientes](https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/designing-data-governance-that-delivers-value) en toda la empresa y para supervisar el cumplimiento, todo lo cual facilitó la reutilización del producto de datos y, al mismo tiempo, generó confianza entre los usuarios. ## Por dónde empezar Los líderes suelen preguntarse qué productos de datos y arquetipos de consumo obtendrán el mayor y más rápido retorno de la inversión. La respuesta es diferente para cada organización. Para encontrar el enfoque adecuado para sus empresas, los ejecutivos tienen que[evaluar la viabilidad y el valor potencial](/2021/05/getting-ai-to-scale) de casos de uso en cada dominio empresarial (puede ser un proceso empresarial principal, el recorrido de un cliente o empleado o una función) y agrúpelos primero por los productos de datos que necesitan y, después, por los arquetipos de consumo involucrados. Clasificar los casos de uso de esta manera ayuda a los líderes a secuenciar el trabajo de manera más eficiente y a obtener una rentabilidad de la inversión más rápida. Por ejemplo, pueden acabar impulsando algunos casos de uso de menor valor si aprovechan los productos de datos y los arquetipos de consumo de los casos de uso de mayor valor. Para los ejecutivos del banco nacional, este enfoque puso de manifiesto varias prioridades. Primero se dieron cuenta de que un producto de datos de clientes que respaldara sus casos de uso más críticos de marketing y gestión del fraude podía generar un enorme valor. Luego, identificaron primero el tipo de datos que el producto necesitaba recopilar. Algunos de esos casos de uso requerían identificadores básicos de los clientes y datos de referencia (como datos demográficos o de segmentación), mientras que otros requerían datos exhaustivos del comportamiento de los clientes. El banco también se dio cuenta de que los dos arquetipos de consumo que debía perseguir primero eran un entorno limitado de descubrimientos y un análisis avanzado, que, en combinación, respaldarían la mayoría de los casos de uso prioritarios de fraude y marketing de la empresa. Las decisiones sobre los productos de datos suelen implicar un equilibrio entre el impacto, la viabilidad y la velocidad. Lo ideal sería que los arquetipos de consumo y productos objetivo iniciales se aplicaran inmediatamente a casos de uso de gran valor y a una larga cartera de otros, como lo hizo el producto del proveedor de telecomunicaciones para sus equipos de red. Sin embargo, las consideraciones de viabilidad pueden hacer que la empresa ajuste su enfoque. Por ejemplo, puede tener sentido generar impulso primero en un área de la organización que tenga experiencia en datos y que haya ganado algo de terreno con los productos de datos, incluso si no es ahí donde reside la mayor oportunidad. Vimos lo que pasó en la empresa minera. Al principio, optó por desarrollar dos productos que respaldaran su planta de procesamiento de minerales, donde los casos de uso ya se habían demostrado con éxito, los gerentes estaban entusiasmados por perseguir más, el equipo tenía muchos datos preparados con los que trabajar y había expertos con una amplia experiencia disponibles para ayudarlo. ### . . . La mayoría de los líderes actuales están haciendo grandes esfuerzos para convertir los datos en una fuente de ventaja competitiva. Pero esas iniciativas pueden fracasar rápidamente si las organizaciones no se aseguran de que el arduo trabajo que realizan hoy se pueda reutilizar mañana. Las empresas que gestionan sus datos como un producto tendrán una ventaja de mercado significativa en los próximos años, gracias al aumento de la velocidad y la flexibilidad y a las nuevas oportunidades que ese enfoque puede ofrecer. Read more on [**Analytics and data science**](/topic/subject/analytics-and-data-science?ab=articlepage-topic) or related topic [**Data management**](/topic/subject/data-management?ab=articlepage-topic)