Gracias a la creciente disponibilidad de la IA, incluidos los algoritmos de aprendizaje automático, que crean deliberadamente ciclo de comentarios sobre los datos de los clientes s ahora es posible para la mayoría de los productos y servicios. Esto significa que, a medida que una empresa recopila más datos de los clientes, puede utilizarlos en algoritmos de aprendizaje automático para mejorar su producto o servicio y, así, atraer a más clientes y generar aún más datos de clientes. Para algunos productos, es fácil; para otros, hay que encontrar formas más creativas de diseñar los ciclos de retroalimentación de datos. En este artículo se explica cómo hacerlo.

•••

La combinación de los datos de los usuarios y la IA suele crear bucles de retroalimentación de los datos. Esto significa que, a medida que una empresa recopila más datos de los clientes, puede utilizarlos en algoritmos de aprendizaje automático para mejorar su producto o servicio y, así, atraer a más clientes y generar aún más datos de clientes. Piense, por ejemplo, en los motores de búsqueda: cuanto más personas busquen en Google y hagan clic en los enlaces proporcionados, más datos recopilará Google, lo que permite a sus algoritmos ofrecer resultados de búsqueda más precisos y relevantes, atraer aún más usuarios y búsquedas, etc.

Estos bucles de retroalimentación de datos pueden ayudar a crear unventaja competitiva sostenible, siempre que existen ciertas condiciones. Sin embargo, la fuerza de estos ciclos de retroalimentación de datos puede variar considerablemente y las empresas pueden tomar decisiones deliberadas en sus productos o servicios para reforzarlos. Cómo hacerlo es el tema central de este artículo.

No todos los bucles de retroalimentación de datos se crean de la misma manera

Algunos productos tienen circuitos de retroalimentación de datos muy fuertes por naturaleza. Piense en los termostatos inteligentes, en los que cada ajuste de temperatura por parte del usuario proporciona una valiosa señal de datos que el dispositivo puede utilizar para lograr una mejor personalización. O Google Maps, donde la ruta que elige cada usuario y el tiempo que tarda en llegar al destino ayudan al algoritmo a mejorar sus recomendaciones de rutas y predicciones de tráfico. O Spotify, cuyo sistema de recomendaciones aprende directamente de las elecciones de los usuarios sobre qué canciones recomendadas incluir en sus listas de reproducción y con qué frecuencia las escuchan. La razón por la que estos ciclos de retroalimentación son tan fuertes es que los usuarios revelan señales claras e inequívocas de sus preferencias en el proceso natural de consumo del producto, que se aprovechan para mejorar aún más el producto o el servicio para esos usuarios.

En el otro extremo del espectro hay productos con bucles de retroalimentación de datos naturalmente débiles. Su uso es difícil de rastrear o no revela información útil sobre las preferencias de los usuarios, o es difícil y lento recopilar comentarios informativos de los usuarios.

Obviamente, esto es cierto con los productos «tontos» tradicionales, como los coches, los muebles y la ropa: no están conectados digitalmente, por lo que la única manera de crear ciclos de comentarios de los clientes es recopilar los comentarios de forma manual a través de grupos focales y encuestas, lo que solo puede ayudar en futuros lanzamientos de productos. Y también es cierto para los productos en los que los ciclos de retroalimentación implican ciclos muy largos de aprendizaje y mejora, como los sistemas de calificación crediticia de las instituciones financieras (los comentarios provienen principalmente de los impagos, que tardan años en materializarse) o la inversión de riesgo (se necesitan años para determinar qué empresas emergentes tienen éxito y cuáles fracasan).

Menos obvio es que incluso algunos productos digitales que recopilan muchos datos de los usuarios pueden tener ciclos de retroalimentación de datos débiles. Esto significa que la mayor parte de su valor proviene de la preprogramación y de la formación interna de datos y no aumenta mucho, si es que lo hace, al aprender de los usuarios. Por ejemplo, dispositivos portátiles populares como Fitbit,Guau, Nutrisense, y Oura tienen bucles de retroalimentación de datos bastante débiles, a pesar de que proporcionan mucha información sobre los datos.

Pensemos en el último rastreador de Fitbit, elCarga 5, que tiene un impresionante lista de funciones . El rastreador mide una amplia gama de datos del usuario (frecuencia cardíaca, velocidad y distancia de movimiento, sueño, temperatura de la piel) y proporciona información valiosa, como la variabilidad de la frecuencia cardíaca, el tiempo que pasa en diferentes zonas de frecuencia cardíaca, la puntuación de aptitud cardiovascular, la puntuación de preparación para hacer ejercicio y la puntuación de calidad del sueño. Sin embargo, esta información no parece mejorar con el uso o el aumento de los usuarios. Son estadísticas resumidas sencillas de lo que mide el rastreador o el resultado de comparaciones entre los datos de usuario medidos por el rastreador Fitbit y los puntos de referencia relevantes basados en investigaciones preexistentes, que están preprogramadas en el sistema Fitbit.

Por ejemplo, Fitbitexplica que «la puntuación de aptitud cardiovascular se determina según su frecuencia cardíaca en reposo, edad, sexo, peso y otros datos personales». Del mismo modo, la puntuación de preparaciónse basa en los patrones de sueño recientes del usuario medidos por el rastreador, que presumiblemente se comparan con algunos puntos de referencia estables. En otras palabras, se trata de estimaciones del estado «real» de un usuario, pero no mejoran con más datos de uso, simplemente porque Fitbit no tiene forma de averiguar qué tan cerca están sus estimaciones del estado «real» y ajustarlas en consecuencia.

Por supuesto, puede haber algunas formas limitadas en las que los wearables podrían mejorar el valor ofrecido a cada usuario en función de los datos de uso de ese usuario u otros usuarios. En el nivel más básico, cualquier producto conectado puede aprender qué interfaz de usuario es más atractiva (por ejemplo, mediante pruebas A/B), que técnicamente es una forma de circuito de retroalimentación de datos, aunque limitado, lo que está en juego para la mayoría de los productos.

Y hay correlaciones que los dispositivos portátiles podrían analizar para recomendar un comportamiento. Por ejemplo, una correlación entre la hora a la que los usuarios se van a dormir y la calidad del sueño, que se puede utilizar para recomendar una hora óptima para irse a dormir; o entre la hora que los usuarios hacen ejercicio y la calidad del sueño, que se puede utilizar para recomendar una hora óptima para hacer ejercicio. En estos casos, a medida que los usuarios ajustan su comportamiento en función de las recomendaciones, el dispositivo portátil recibe comentarios sobre si esto ayuda o no y, por lo tanto, puede mejorar aún más si aprende de los usuarios. Aun así, este tipo de proceso requiere muchos datos de muchos usuarios, y es posible que el proveedor de dispositivos portátiles nunca sepa realmente hasta qué punto correlación significa causalidad.

Por último, considere los ciclos de retroalimentación de datos de los modelos lingüísticos (LLM) de gran tamaño, como los de la IA abiertaChat GPT o el de GoogleBardo. Estos modelos ingieren enormes cantidades de datos de la web y utilizan modelos de aprendizaje automático para generar respuestas a las preguntas de los usuarios. En las primeras versiones de estos modelos, sus capacidades se determinaban en gran medida mediante la formación y las pruebas «internas» previas al lanzamiento; la calidad de sus respuestas solo mejora de forma moderada con más usuarios o más uso. De hecho, al momento de escribir este artículo, hay dos mecanismos principales que crean bucles de retroalimentación de datos en torno a los LLM:

  1. Los usuarios hacen clic en los botones con el pulgar hacia arriba o hacia abajo al final de las respuestas. (Es probable que la mayoría de los usuarios lo ignoren la mayoría de las veces).
  2. Los usuarios hacen preguntas de seguimiento, que podrían indicar si la respuesta ha sido satisfactoria o no. (Es probable que esta inferencia sea difícil en la mayoría de los casos).

Tenga en cuenta la diferencia con la búsqueda normal (en Bing o Google), en la que la elección del usuario de los enlaces mostrados en los que hacer clic proporciona una señal mucho más clara de la relevancia de los resultados de la búsqueda. Por supuesto, las cosas pueden cambiar drásticamente a medida que los LLM se actualicen y comiencen a incorporar formas más fiables de generar bucles de retroalimentación de datos, un tema que analizaremos en la siguiente sección.

Cómo mejorar los bucles de retroalimentación de datos

La pregunta clave es, entonces, que para los productos en los que los ciclos de retroalimentación del aprendizaje basados en los datos no son fuertes de forma natural, ¿qué se puede hacer para mejorarlos?

(Re) diseñe el producto para crear bucles de retroalimentación de datos naturales.

Lo ideal sería (re) diseñar el producto o servicio de tal manera que los clientes, en el transcurso natural del uso del producto, crearan datos que indicaran qué tan útil o eficaz es el producto para los usuarios. Luego, el proveedor puede utilizar estos datos para mejorar la calidad del producto o servicio.

Por ejemplo, los LLM podrían añadir nuevas funciones que permitan a los usuarios guardar y organizar las respuestas que les resulten más útiles en carpetas de favoritos (parecidas a marcadores) y eliminar las que no quieran conservar. Podrían añadir una función de creación de documentos (similar a Microsoft Word) en la que copiarían y editarían las respuestas de LLM. También podrían crear juegos de desafíos (IA contra usuarios) y tablas de clasificación en los que la IA y los usuarios traten de responder a las preguntas y los usuarios voten según las respuestas. Y así sucesivamente. La idea es crear oportunidades para que los usuarios proporcionen señales fiables de la calidad percibida de las respuestas de los LLM, que luego puedan utilizarse para mejorar sus algoritmos.

Fitbit y otros dispositivos portátiles podrían añadir pruebas o desafíos de acondicionamiento físico estandarizados (por ejemplo, correr una milla o hacer tres series de 20 abdominales) y medir el tiempo total, la frecuencia cardíaca y otros datos biométricos de los usuarios antes y después. Esto permitiría a la IA de los wearables predecir con mayor precisión la preparación de los usuarios para hacer ejercicio, a medida que observen más datos de más usuarios. Lo que, a su vez, debería llevar a los usuarios a confiar cada vez más en los wearables para decidir cuándo hacer ejercicio. Por supuesto, esto sigue basándose en suposiciones sobre el comportamiento no observado de los usuarios, pero el punto clave es que los dispositivos necesitan realizar algún tipo de cuasiexperimentos con los usuarios para obtener datos que puedan ayudarlos a aprender y mejorar.

Intégrelo con otros productos para crear bucles de retroalimentación de datos.

En muchos casos, rediseñar el producto o servicio real para diseñar circuitos de retroalimentación puede resultar difícil (como se ilustra en el ejemplo anterior de dispositivos portátiles). Una forma alternativa de lograr el mismo objetivo es integrar su oferta con otros productos existentes que los clientes ya utilizan o podrían utilizar.

Por ejemplo, Fitbit (o Whoop u Oura) podría crear una integración con los termostatos inteligentes para permitir que el dispositivo portátil controle automáticamente la temperatura ambiente durante el sueño del usuario. Esto permitiría a la IA del dispositivo portátil ajustar la temperatura y determinar su efecto en la calidad del sueño del usuario, según lo medido por el dispositivo portátil. Cuanto más utilice un cliente el dispositivo portátil (es decir, lo lleve puesto para dormir), más cerca estará el dispositivo portátil de determinar el patrón de temperatura ideal para un usuario determinado. Esto se puede conseguir experimentando automáticamente con muchos patrones de temperatura diferentes mientras el usuario duerme.

O los wearables podrían integrarse con Peloton o Tonal, que ofrecen entrenamientos estandarizados, de modo que la IA de Fitbit pueda correlacionar la biometría del usuario con el tipo y la intensidad de los entrenamientos. La ventaja con respecto a la opción descrita anteriormente (en la que los dispositivos portátiles simplemente piden a los usuarios que realicen entrenamientos específicos) es que aquí se puede observar el comportamiento real del entrenamiento.

Del mismo modo, los LLM podrían integrarse con cualquier software o herramienta en la que se utilicen sus respuestas. Por ejemplo, podrían integrarse con un software de creación o edición de contenido (por ejemplo, Google Docs, Substack, Salesforce), lo que les permitiría observar qué partes de sus respuestas acaban utilizándose en el contenido creado por los usuarios y utilizar esos datos para mejorar sus respuestas.

Pida comentarios a los usuarios de una manera mínimamente intrusiva para que vean claramente las ventajas.

Aun así, para muchos productos, encontrar formas de hacer que los comentarios de los usuarios sean inherentes al uso del producto (directamente o mediante la integración) puede resultar difícil o imposible. De no ser eso, la siguiente mejor opción es pedir comentarios a los usuarios de forma explícita. La mayoría de los productos y servicios en línea lo hacen hasta cierto punto. Como se ha mencionado anteriormente, los LLM piden a los usuarios el visto bueno hacia arriba o hacia abajo después de cada respuesta generada; Netflix pide a los usuarios un visto bueno hacia arriba o hacia abajo después de cada contenido que ven para mejorar su sistema de recomendaciones; Amazon pide a los compradores que valoren los productos que han comprado; Airbnb pide a los viajeros y a los anfitriones que se valoren entre sí, etc.

Por supuesto, la dificultad de pedir comentarios explícitos es obtener información útil sin molestar demasiado a los usuarios. A nadie le gusta que lo acosen con encuestas que «solo ocupan tres minutos de su tiempo» o ver encuestas de comentarios («¿qué probabilidades hay de que nos recomiende a sus amigos?») abrir todas las demás pantallas.

Además de hacer que las solicitudes de comentarios de los usuarios sean lo más fáciles y sencillas posible, ayuda a comunicar con claridad a los usuarios cómo esos comentarios podrían beneficiarlos personalmente siempre que sea posible (por ejemplo, «al calificar esta película, Netflix le dará mejores recomendaciones sobre las otras películas que probablemente le gusten»). Esto garantiza que tienen un incentivo para dar comentarios honestos.

Incluya a los humanos al tanto.

Una forma importante de crear un ciclo de retroalimentación de datos y, al mismo tiempo, minimizar la carga de comentarios para los usuarios es incluir a las personas en el ciclo para complementar (o incluso reemplazar) los comentarios de los usuarios. Un buen ejemplo de ello esAlexi, un servicio de investigación legal impulsado por la IA que se ofrece a bufetes de abogados. Los clientes pueden enviar preguntas legales junto con cualquier dato relevante del caso, y Alexi le envía una nota de investigación legal con una respuesta, con resúmenes de la jurisprudencia y los litigios pertinentes. Los memorandos los genera la IA de Alexi, pero luego los revisa y modifica (cuando es necesario) el equipo legal interno de Alexi, los humanos informados. Por lo tanto, la IA de Alexi tiene la ventaja de aprender de las consultas de los clientes y de los comentarios implícitos que proporcionan las correcciones del equipo interno, sin sobrecargar a los clientes. Esto funciona bien aquí porque los clientes no esperan respuestas instantáneas. (Alexi promete una respuesta en 24 horas, un plazo muy razonable en este contexto). Tampoco hacen cientos de preguntas al día como lo hacen los usuarios de Chat GPT o Bard.

Otro ejemplo del buen uso de los humanos al tanto esGramaticalmente, un asistente de escritura con IA que ayuda a los usuarios a mejorar la gramática, la ortografía, la puntuación y el estilo. Grammarly ofrece sugerencias en tiempo real, mientras los usuarios escriben en cualquier aplicación o sitio (por ejemplo, procesadores de textos, correo electrónico, redes sociales, aplicaciones de comunicación). Los usuarios tienen la opción de aceptar o rechazar las modificaciones sugeridas, lo que obviamente ayuda a mejorar el algoritmo y crea un ciclo de retroalimentación de datos. Sin embargo, Grammarly también utiliza revisores humanos para comprobar las sugerencias del modelo de IA y revisar los casos ambiguos (un usuario rechaza una sugerencia de edición, pero no está claro por qué lo hizo), en lugar de pedir comentarios a los usuarios.

Otros ejemplos de productos o servicios basados en la IA que utilizan personas informadas para complementar o reemplazar los comentarios de los usuarios incluyen la moderación del contenido en las plataformas de redes sociales (los moderadores humanos participan en los casos más complejos con los que la IA tiene problemas), los servicios de radiología impulsados por la IA, comoBrillante (los especialistas humanos complementan los diagnósticos de la IA y corrigen cualquier problema en el diagnóstico que el sistema escribe automáticamente) y los servicios de seguridad impulsados por la IA, como Deep Sentinel (la IA detecta las amenazas y decide cuándo pasar a ser guardias humanos, quienes entonces pueden decidir si la IA tomó la decisión correcta).

Por supuesto, el principal punto débil del enfoque de personas informadas es que no se adapta bien a cientos de miles o millones de clientes o a servicios con una frecuencia de uso muy alta y con expectativas de tiempos de entrega rápidos. No muchas empresas pueden darse el lujo de contratar ejércitos de más de 15 000 moderadores de contenido como lo hace Meta para Facebook. Esta es la razón por la que la mayoría de las empresas que emplean a personas informadas tratan de minimizar el tiempo que necesitan las personas en el proceso. Sin embargo, el enfoque de personas informadas puede ser muy eficaz en las primeras etapas de un producto/servicio, cuando la curva de aprendizaje es más pronunciada. La esperanza es que la necesidad de implicar a los humanos disminuya rápidamente con el tiempo a medida que el sistema de IA aprenda.

• • •

La creciente disponibilidad de la inteligencia artificial, incluidos los algoritmos de aprendizaje automático, significa que ahora es posible crear deliberadamente bucles de retroalimentación de datos para la mayoría de los productos y servicios. Para algunos productos, es fácil; para otros, hay que encontrar formas más creativas de diseñar los ciclos de retroalimentación de los datos, mediante integraciones o solicitudes de comentarios de los usuarios que sean mínimamente intrusivas y que redunden en beneficio de los usuarios. Cuando son fuertes, estos circuitos de retroalimentación pueden crear una forma de efecto de red (más usuarios aportan más datos, lo que hace que el producto sea mejor y, a su vez, atrae a más usuarios, etc.) y aumentar la ventaja competitiva.