Proteger la privacidad de los clientes requiere algo más que anonimizar sus datos
por Sachin Gupta, Matthew J. Schneider

Becky Hayes/Eyeem/Getty Images
Hoy en día, un buen marketing se basa en disponer de datos de los clientes detallados y precisos. Y las empresas, no es sorprendente que estén deseosas de recolectar enormes tesoros. Por ejemplo, Amazon hace un seguimiento continuo del comportamiento de sus 100 millones de miembros Prime, un ejemplo de datos «propios». Y muchas empresas han descubierto que compartir la información de sus propios clientes con otras empresas crea sinergias para ambas partes, especialmente con la creciente disponibilidad de los datos del «Internet de las cosas» (sensores GPS, contadores inteligentes de servicios públicos, dispositivos de acondicionamiento físico, etc.). Estos son ejemplos de datos «de segunda parte». Por último, muchas empresas complementan sus datos propios con datos de «terceros» de empresas como Acxiom, que recopila hasta 1500 puntos de datos de 700 millones de consumidores en todo el mundo.
El potencial de llevar a cabo un marketing eficaz basado en datos con estas bases de datos aumentadas es enorme. Al mismo tiempo, la preocupación por la privacidad de los clientes nunca ha sido tan grande debido a los numerosos hackeos de privacidad muy publicitados, como el reciente escándalo entre Facebook y Cambridge Analytica. Las respuestas de los consumidores a estas violaciones de la privacidad van desde la creciente reticencia a compartir sus datos hasta una erosión masiva de la confianza en la marca. Por ejemplo, cuando hackearon las tres mil millones de cuentas de usuarios de Yahoo, Verizon redujo el precio de compra de la empresa en 350 millones de dólares.
Centro Insight
Marketing basado en datos
Patrocinado por Google
La ciencia de la narración y el rendimiento de la marca.
Los estudios han demostrado que los consumidores estén dispuestos a compartir información con una marca en la que confíen que protegerá su información. Se está promulgando una normativa mayor para garantizar que las empresas rindan cuentas y que los consumidores tengan derecho a eliminar, transferir u obtener una copia de sus datos. Por ejemplo, el Reglamento general de protección de datos (GDPR) entró en vigor en la Unión Europea el 25 de mayo y está siendo vigilado de cerca en los EE. UU.
La pregunta del billón de dólares es si es posible que las empresas aprovechen las ventajas prometidas del marketing basado en datos y, al mismo tiempo, mantener la privacidad de los datos de los clientes.
Enfoques actuales de protección de datos
El enfoque de protección de datos más común que siguen las empresas actualmente es controlar el acceso a los datos una vez recopilados. Esto control de acceso el enfoque es lamentablemente inadecuado por varias razones. En primer lugar, tan pronto como una empresa comparte los datos de forma interna o externa, su capacidad de controlar el acceso se deteriora rápidamente. Además, prácticas como la seudonimización ( que será exigido por el GDPR) — definidas como «el procesamiento de datos personales de tal manera que los datos personales ya no puedan atribuirse a un sujeto de datos específico sin el uso de información adicional», no son suficientes, como explicamos a continuación.
Considere el ejemplo que se muestra en la siguiente ilustración, en el que dos minoristas establecen una asociación de intercambio de datos con una segunda parte. Aunque los datos del minorista B se seudonimizaron al eliminar toda la información de identificación personal, no son realmente anónimos, ya que la combinación del rango de edad, la marca horaria, el sexo y el código postal crea un registro de población único que se puede vincular a la información adicional del minorista A. Si bien estos minoristas pueden cumplir con la ley, existe un importante riesgo de privacidad para los consumidores.
Los datos sintéticos como protección
Las agencias públicas, como la Oficina del Censo de los Estados Unidos y el Departamento de Agricultura, que recopilan datos confidenciales (por ejemplo, las compras típicas de los beneficiarios del Programa de Asistencia Nutricional Suplementaria) son exigido por ley para compartir los datos públicamente. Estas agencias siguen un enfoque de transformar los datos originales en datos protegidos, que luego se publican. En este enfoque, las variables confidenciales que deben protegerse en los datos originales se alteran sistemáticamente mediante métodos como los siguientes (para ilustrarlo, utilizamos el ejemplo de la protección de las ventas semanales de las tiendas minoristas en los datos de los puntos de venta):
- Añadir ruido aleatorio. Por ejemplo, las observaciones se agrupan en deciles en función de las ventas y se añade un número aleatorio a las ventas de cada decil.
- Redondeo. Por ejemplo, las ventas se redondean a la centena más cercana
- La mejor codificación. Por ejemplo, todas las ventas por encima de un valor límite, como 100, se establecen en 100.
- Intercambio. Por ejemplo, las observaciones se dividen en grupos y se intercambian sus datos de ventas.
- Agregando. Por ejemplo, las rebajas semanales se suman y los precios y las promociones se calculan en todas las tiendas de un mercado.
- Crear datos sintéticos. Por ejemplo, las ventas se simulan a partir de una distribución de probabilidad.
Estas agencias utilizan el proceso de perturbación para gestionar la compensación entre preservar la información útil de los datos originales y reducir la posibilidad de que un intruso infrinja la privacidad. Los datos originales se guardan en entornos de acceso seguro, a menos que sea necesario eliminarlos. Creemos que las empresas deberían considerar la posibilidad de sacar una página del manual de estas agencias para reforzar sus propias prácticas de protección de datos.
Lo hemos mostrado en dos artículos publicados ( aquí y aquí) cómo se puede utilizar un modelo estadístico para convertir los datos de marketing originales en datos sintéticos para la protección de los consumidores. Una idea clave de este enfoque es que los objetivos de marketing para los que se recopilan los datos se tengan en cuenta en el proceso de síntesis, con lo que se compensa cuidadosamente la pérdida de información con el aumento de la protección.
Por ejemplo, pensemos en un tipo de datos muy utilizado, los datos de puntos de venta minoristas, que recopilan empresas de estudios de marketing como ACNielsen y SymphonyIRI en tiendas minoristas. Luego, los datos se agregan en las tiendas minoristas de un mercado para evitar que se identifiquen las tiendas, y casi todas las principales empresas de bienes de consumo envasados, como Procter & Gamble y Unilever, los compran. Los directores de marca utilizan los datos para supervisar el rendimiento de sus marcas y para calcular las métricas de marketing, como la elasticidad de los precios y los factores de aumento de las promociones. Sin embargo, la agregación puede distorsionar gravemente las métricas que los directores de marca utilizan para tomar decisiones importantes, como cuánto gastar en promociones comerciales. Un enfoque alternativo para proteger las identidades de las tiendas consiste en convertir los datos originales en datos sintéticos mediante un modelo estadístico. Nuestro investigación ha demostrado que este enfoque proporciona métricas mucho más precisas que los datos agregados, pero protege muy bien las identidades de las tiendas.
Los beneficios prometidos del marketing basado en datos corren un grave riesgo, a menos que las empresas puedan hacer un mejor trabajo de protección contra la divulgación de datos no deseada. El enfoque actual de controlar el acceso a los datos o eliminar la información de identificación personal no controla adecuadamente el riesgo de divulgación. Otros enfoques, como la agregación, provocan una grave degradación de la información. Es hora de que las empresas consideren la posibilidad de utilizar enfoques estadísticos para convertir los datos originales en datos sintéticos, de modo que sigan siendo valiosos para el marketing basado en datos y, al mismo tiempo, estén debidamente protegidos.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.