Para pasar del Big Data al Big Insight, comience con una imagen
por Sinan Aral. Visualization by Nikolaos Hanselmann
Aunque la visualización de datos ha producido algunas de las exhibiciones artísticas más cautivadoras de los últimos tiempos, algunas de las cuales se han presentado en exposiciones en el Museo de Arte Moderno de Nueva York y en innumerables instalaciones de arte de todo el mundo, los líderes empresariales se preguntan: ¿es procesable la visualización de datos?
Creo que sí. En mi papel de becario residente en El New York Times Laboratorio de I+D, colaboro con uno de los equipos de I+D digital más avanzados del mundo para averiguar cómo podemos extraer información útil a partir de los macrodatos.
¿Qué tamaño? Masivo: estamos documentando todos los tuits, retuits y clics de cada URL abreviada de Twitter y Facebook que apuntan a New York Times contenido y, luego, combinarlo con los registros de navegación de lo que hacen esos usuarios cuando llegan al Veces. Este proyecto es pariente del conocido proyecto Cascade. Piense en ello como Cascade 2.0.
Lo hacemos para entender y predecir cuándo una cascada o conversación en línea provocará una oleada de consumo de contenido en el Veces y también cuándo no lo hará. Lo que es más importante, nos interesa cómo la conversación boca a boca impulsa el número de lectores, las suscripciones y los ingresos por publicidad; cómo Veces puede mejorar su propia participación en la conversación para impulsar la participación; cómo podemos identificar a los lectores realmente influyentes que a su vez impulsan la participación; y cómo Veces puede entonces atraer a estos usuarios influyentes de una manera que complemente las propias necesidades e intereses de los usuarios. Hágalo y convertiremos ese análisis estadístico, como verá más abajo, en flujos de datos elegantes y artísticos en tiempo real.
Gestionar las transmisiones, archivar las sesiones y almacenar y manipular la información son en sí mismas tareas hercúleas. Pero el desafío aún mayor es transformar los hermosos macrodatos en conocimientos útiles, significativos y relevantes para la toma de decisiones. Hemos descubierto que la visualización es una de las guías más importantes en esta búsqueda de conocimiento, esencial para entender dónde debemos buscar y qué debemos buscar en nuestros análisis estadísticos.
Por ejemplo, estas son tres visualizaciones que nos han ayudado a adquirir conocimientos. Muestran cascadas de tuits y retuits en forma de líneas y puntos, aproximadamente tres tipos diferentes Veces artículos a lo largo del tiempo, combinado con el volumen de clics de cada artículo sincronizado en el tiempo y mostrado como un gráfico negro debajo de cada cascada. Cada panel cuenta una historia diferente sobre la interacción con el contenido.
Para el primer artículo, hay una conversación considerable en Twitter y varios picos importantes de tráfico. Pero el volumen de clics parece independiente de la conversación en Twitter: el mayor aumento de tráfico, resaltado en azul, se produce cuando hay muy poca actividad en Twitter. En este caso, un enlace destacado en un blog o una noticia que haga referencia a la noticia, en lugar de la propia conversación de Twitter, probablemente esté generando tráfico.
En el segundo artículo, la conversación en Twitter es intensa. Hay muchos tuits y retuits del artículo, pero el artículo en sí recibe muy poco tráfico. La gente habla del artículo en Twitter, pero no lo lee. Esto ocurre a veces cuando el mensaje principal de un artículo desencadena un debate o una conversación que puede tener lugar sin que el contenido del artículo sea tan importante, por ejemplo, cuando una noticia puntual contiene pocos análisis o contenido editorial, o cuando la conversación o el debate se aleja del artículo y desarrolla su propio contenido independiente.
En el tercer y último artículo, una intensa conversación en Twitter va de la mano con la participación. A medida que la gente tuitea y retuitea el artículo, sus seguidores hacen clic e interactúan con el contenido en sí. Esta estrecha relación entre la conversación en línea y el tráfico del sitio web se hace más pronunciada cuando las tres «personas influyentes» etiquetadas en la figura inspiran los dos picos de tráfico más importantes a lo largo del ciclo de participación del artículo.
Con solo estas tres visualizaciones de datos, hemos aprendido algunos matices importantes sobre la llamada viralidad. La relación entre las conversaciones de boca en boca en Internet y la participación no es tan simple como que algo simplemente «se haga viral». Surgen diferentes patrones con los diferentes tipos de contenido.
Aun así, las imágenes no pueden contar toda la historia. Aquí vemos algunas correlaciones claras, pero las complejas dependencias condicionales y la autocorrelación temporal y de red hacen que sea necesario crear modelos estadísticos causales más sofisticados que generen información verdadera y confiable sobre la influencia del boca a boca.
Lo que sí ayudan estas imágenes es a saber dónde buscar y qué preguntas hacer a los datos. Es decir, no podemos construir los modelos más complejos hasta que no conozcamos los lugares más adecuados para construirlos. Estas imágenes nos dan parte de esa visión.
Cascade 2.0 se basará en análisis sofisticados y requerirá visualización de datos. Hacer preguntas importantes y evitar las innecesarias es esencial para avanzar de forma eficaz y eficiente con el big data. Sin visualización, somos mucho menos eficientes a la hora de responder a las preguntas cuyas respuestas nos enseñan algo. Por eso, la visualización de los datos debe ser una de las herramientas más importantes para los científicos de datos. Es nuestra antorcha en un bosque espeso y oscuro.
Artículos Relacionados

Investigación: La IA generativa hace que la gente sea más productiva y esté menos motivada

Arreglar los chatbots requiere psicología, no tecnología
Los chatbots dotados de IA se están convirtiendo en el nuevo estándar para la gestión de consultas, reclamaciones y devoluciones de productos, pero los clientes se alejan de las interacciones con los chatbots sintiéndose decepcionados. La mayoría de las empresas intentan solucionar este problema diseñando mejores modelos de IA en sus chatbots, pensando que si los modelos suenan lo suficientemente humanos, el problema acabará desapareciendo. Pero esta suposición es errónea. Esto se debe a que el problema de fondo no es tecnológico. Es psicológico: Hay que engatusar a la gente para que vea a los chatbots como un medio positivo de interacción. Los autores han analizado recientemente las últimas investigaciones sobre chatbots e interacciones IA-humanos, y en este artículo presentan seis acciones probadas que puede llevar a cabo al desplegar su chatbot de IA para impulsar la satisfacción, la percepción positiva de la marca y las ventas.

Investigación: ¿Está penalizando a sus mejores empleados por desconectar?
Para combatir el creciente desgaste del personal, muchas empresas han defendido programas de bienestar y han fomentado un enfoque renovado en el equilibrio entre la vida laboral y personal. Pero un nuevo estudio descubrió que incluso cuando los líderes reconocían que desvincularse del trabajo aumenta el bienestar de los empleados y mejora su rendimiento laboral, los directivos seguían penalizando a los empleados que adoptaban estos comportamientos cuando optaban a un ascenso o estaban siendo considerados para un nuevo puesto. Basándose en sus conclusiones, los investigadores ofrecen sugerencias para ayudar a las empresas a crear políticas y construir una cultura que proteja los límites de los trabajadores, evite el agotamiento y recompense el trabajo fuerte.