Los vendedores de consumo gastan mucho dinero en comprar los nombres de los posibles clientes que pertenecen a un grupo determinado al que intentan llegar (hombres interesados en los deportes, por ejemplo, o personas de mediana edad interesadas en viajar. Sin embargo, los agentes de datos que venden esos datos no revelan cómo están creados sus perfiles ni cuáles son sus índices de precisión. Los autores compararon los datos vendidos con la información disponible públicamente y descubrieron que el nivel de precisión solía ser muy bajo.
•••
Se estima que recopilar y vender datos sobre personas es un negocio de 200 000 millones de dólares, y todo apunta a un crecimiento continuo del negocio de corretaje de datos.
Así es como funciona la empresa cuando los datos se venden a vendedores de consumo. Los agentes de datos recopilan información sobre los clientes siempre que pueden: mediante tarjetas de fidelización, registros públicos, publicaciones en las redes sociales y, la mayoría de las veces, rastreando su comportamiento de navegación en diferentes sitios web. Toda esta información de los clientes rastreada se envía luego a algoritmos de aprendizaje automático, que crean perfiles segmentados de grupos de personas similares. Estos perfiles digitales se agrupan entonces como «audiencias»; los grupos típicos pueden ser «interesados en la moda» o «hombres de 25 a 54 años». Los vendedores pueden comprar estas audiencias listas para usar a los corredores de datos para segmentar los anuncios. Por ejemplo, Nike o Adidas podrían comprar el acceso al segmento de audiencia «interesados en la moda» para comunicarse con los posibles compradores de zapatillas.
Pero hay un problema. El proceso mediante el cual los agentes de datos crean estos segmentos se mantiene en secreto por motivos de competencia. Lamentablemente, esto significa que los directores de marketing no saben si pueden confiar en los datos de audiencia, a pesar de que estas compras suelen representar una parte importante de sus presupuestos de medios. New York Times El CEO Mark Thompson preguntó una vez: «Cuando decimos que un miembro del público es una fashionista femenina de 20 a 30 años, ¿qué probabilidades hay de que sea cierto?»
Hace poco pusimos a prueba la precisión de los segmentos de audiencia populares que ofrecen varios corredores. Analizamos la edad y el sexo, así como los intereses de los clientes, como interesado en los deportes, interesado en viajar, y interesado en el acondicionamiento físico. Para comprobar la precisión, utilizamos datos de entornos en los que las personas habían revelado esta información voluntariamente. Por ejemplo, comparamos las características de los segmentos con los datos de los consumidores proporcionados por los paneles de encuestas, que también se validaron de forma cruzada con información de Facebook o de una institución financiera.
En todas nuestras pruebas, descubrimos que la calidad de la información para los consumidores que venden los corredores de datos varía considerablemente. Mucho es similar o incluso peor que lo que obtendría si utilizara el azar para crear una lista de objetivos. Los datos demográficos fueron particularmente decepcionantes. Por ejemplo, la precisión media de los segmentos de género que clasifican a los hombres fue solo del 42,5%, lo que es inferior al 50% de probabilidades naturales de identificar a los hombres. Los datos sobre la edad eran ligeramente mejores, pero no mucho; de media, en el 77% de los casos, el nivel de edad también era incorrecto. (Si bien la precisión media del 23% parece baja, este resultado fue al menos superior al de los mensajes aleatorios a personas, lo que arrojaría una precisión del 10 al 18% para un grupo de edad).
Los segmentos basados en intereses parecían ser más precisos a primera vista. En aproximadamente el 80% de los casos, la información sobre los intereses de las personas era correcta. Sin embargo, eso no es tan tranquilizador como parece. La mayor precisión parece estar relacionada con el hecho de que los atributos populares que caracterizan al «público» aparecen con mucha frecuencia en la población general; por ejemplo, a muchas personas en Australia y EE. UU. les gustan los deportes, por lo que identificar a alguien que esté interesado en los deportes no es tan difícil. En otras palabras, las audiencias basadas en intereses tampoco eran especialmente fiables. Por supuesto, algunos agentes de datos eran mejores que otros.
El problema de los datos de mala calidad se agrava por el hecho de que los vendedores pagan mucho por estos perfiles digitales. Los costes exactos dependen del caso individual y del medio utilizado, pero nuestra investigación ha demostrado que el uso de la segmentación digital suele duplicar con creces los costes de publicidad de una campaña. Esa es una gran parte del gasto en los medios de comunicación, con muy poco que mostrar, en muchos casos.
Nuestros hallazgos sugieren que los directores de marketing deben tener cuidado a la hora de decidir comprar perfiles de audiencia para el marketing segmentado, quizás esperar a que tengan una visibilidad fiable de la calidad de lo que compran. Si siguen con las campañas segmentadas basadas en los perfiles de audiencia de los agentes de datos, tal vez quieran evitar el uso de perfiles para segmentos amplios de la población (todas las mujeres, por ejemplo, o todos los consumidores interesados en los deportes). Si el segmento de público deseado es relativamente reducido, es más probable que la campaña sea rentable.