Un marco para elegir el proyecto de IA generativa adecuado

Un marco para elegir el proyecto de IA generativa adecuado
Un marco para elegir el proyecto de IA generativa adecuado

por Marc Zao-Sanders

Resumen:

La IA generativa ha capturado la imaginación del público. Es capaz de producir los primeros borradores y generar ideas prácticamente al instante, pero también puede tener problemas de precisión y otros problemas éticos. ¿Cómo deben las empresas gestionar los riesgos en busca de sus recompensas? Al elegir los casos de uso, tienen que equilibrar el riesgo (¿qué tan probable y perjudicial es la posibilidad de que se generen y difundan falsedades e imprecisiones?) y la demanda (¿cuál es la necesidad real y sostenible de este tipo de producción, más allá de los rumores actuales?). Los autores sugieren utilizar una matriz de 2 × 2 para identificar los casos de uso con el menor riesgo y la mayor demanda.

___

Durante los últimos meses, ha habido una enorme cantidad de bombos y especulaciones sobre las implicaciones de los modelos de lenguajes grandes (LLM), como el ChatGPT de OpenAI, Bardo de Google, Claude de Anthropic, Llama de Meta y, más recientemente, GPT4. ChatGPT, en particular, llegó a 100 millones de usuarios en dos meses, lo que lo convirtió en aplicación para consumidores de más rápido crecimiento de todos los tiempos.

Aún no está claro qué tipo de impacto tendrán los LLM, y las opiniones varían enormemente. Muchos expertos sostienen que los LLM tendrán poco impacto (las primeras investigaciones académicas sugieren que la capacidad de los LLM es restringido a la competencia lingüística formal) o que incluso un volumen casi infinito de datos de entrenamiento basados en texto siga muy limitante. Otros, como Ethan Mollick, argumenta lo contrario: «Las empresas que entiendan la importancia de este cambio —y actúen primero en consecuencia— tendrán una ventaja considerable».

Lo que sí sabemos ahora es que la IA generativa ha capturado la imaginación del público en general y que es capaz de producir primeros borradores y generar ideas prácticamente al instante. También sabemos que puede problemas con la precisión.

A pesar de las preguntas abiertas sobre esta nueva tecnología, las empresas están buscando formas de aplicarla, ahora. ¿Hay alguna manera de superar los argumentos polarizadores, las exageraciones y la hipérbole y pensar con claridad dónde afectará primero la tecnología? Creemos que la hay.

Riesgo y demanda

En cuanto al riesgo, ¿qué tan probable y perjudicial es la posibilidad de que se generen y difundan falsedades e imprecisiones? A pedido, ¿cuál es la necesidad real y sostenible de este tipo de producción, más allá de los rumores actuales?

Es útil considerar estas variables juntas. Pensar en ellos en una matriz de 2 × 2 proporciona un análisis más matizado y único de lo que puede venir. De hecho, los riesgos y las demandas difieren según los diferentes sectores y actividades empresariales. Hemos incluido algunos casos de uso comunes en varios sectores en la siguiente tabla.

Piense en la ubicación que podría ocupar su función empresarial o su sector. Para su caso de uso, ¿en qué medida se reduce el riesgo si se introduce un paso para la validación humana? ¿En qué medida podría ralentizar el proceso y reducir la demanda?

As your company decides where to start exploring generative A I, it’s important to balance risk and demand. One way to think about that is to ask two questions: “How damaging would it be if untruths and inaccuracies were generated and disseminated?” and “What is the real and sustainable need for this kind of output, beyond the current buzz?” In this 2 by 2 matrix, the authors sort common cross-industry use cases by risk and demand to provide examples of the most valuable, least risky applications for a company. For high demand, low risk applications, they suggest marketing, learning, copyediting, code reviews, ideation, and rapid design and reviews. For high demand, high risk applications, they suggest medical diagnoses, production code, legal advice, business intelligence, regulatory and compliance, and technical publishing. For low risk, low demand use, they suggest whimsical applications such as funny twitter bios, and creative, subjective output such as images, jokes, and poems. For low demand, high risk applications, they suggest specialist technical advice, for example, niche medical topics.

La casilla de arriba a la izquierda, donde la consecuencia de los errores es relativamente baja y la demanda del mercado es alta, se desarrollará inevitablemente más y más rápido. Para estos casos de uso, hay un incentivo listo para que las empresas encuentren soluciones y hay menos obstáculos para su éxito. Esperamos ver una combinación de utilización inmediata y sin procesar de la tecnología, así como herramientas de terceros que aprovechen la IA generativa y sus API para su dominio en particular.

Esto ya está ocurriendo en el marketing, donde varias empresas emergentes han encontrado formas innovadoras de aplicar los LLM para generar contenido, textos e ideas de marketing, y han logrado estado de unicornio. El marketing requiere mucha generación e iteración de ideas, mensajes personalizados para audiencias específicas y la producción de mensajes ricos en texto que puedan atraer e influir en el público. En otras palabras, hay usos claros y una demanda demostrada. Es importante destacar que también hay muchos ejemplos que pueden utilizarse para guiar a una IA a la hora de combinar estilo y contenido. Por otro lado, la mayoría de los textos de marketing no contienen muchos datos y los datos que son importantes se pueden corregir editándolos.

Si observamos la matriz, descubrirá que hay otras oportunidades a las que se ha prestado menos atención. Por ejemplo, aprender. Al igual que el marketing, crear contenido para el aprendizaje (para nuestros propósitos, usemos el ejemplo de las herramientas internas de aprendizaje corporativo) requiere una comprensión clara de los intereses de su público y un texto atractivo y eficaz. También es probable que haya contenido que se pueda utilizar para guiar una herramienta de IA generativa. Basándose en la documentación existente, puede pedirle que reescriba, sintetice y actualice los materiales que tiene para dirigirse mejor a los diferentes públicos o para que el material de aprendizaje se adapte mejor a los diferentes contextos.

Las capacidades de la IA generativa también podrían permitir que los materiales de aprendizaje se entreguen de forma diferente, integrados en el flujo de todos los días trabajar o reemplazar las torpes preguntas frecuentes, los abultados centros de conocimiento y los sistemas de venta de entradas. (Microsoft, un Accionista del 49% en OpenAI, ya está trabajando en esto, con un serie de anuncios previsto para este año.)

Los otros usos del cuadro de alta demanda y bajo riesgo de arriba siguen una lógica similar: son para tareas en las que las personas participan a menudo y el riesgo de que la IA juegue rápido y suelto con los hechos es bajo. Tomemos el ejemplo de pedir a la IA que revise un texto: puede darle un borrador, darle algunas instrucciones (si quiere una versión más detallada, un tono más suave, un resumen de cinco puntos o sugerencias sobre cómo hacer que el texto sea más conciso) y revisar sus sugerencias. Como segundo par de ojos, la tecnología está lista para usarse ahora mismo. Si quiere ideas para alimentar una lluvia de ideas (medidas a seguir al contratar a un diseñador multimedia moderno o qué regalarle a una niña de cuatro años a la que le gustan los trenes para su cumpleaños), la IA generativa será una apuesta rápida, fiable y segura, ya que es probable que esas ideas no estén en el producto final.

Rellenar la matriz 2 × 2 anterior con las tareas que forman parte del trabajo de su empresa o equipo puede ayudar a establecer paralelismos similares. Al evaluar el riesgo y la demanda y tener en cuenta los elementos compartidos de determinadas tareas, puede ser un punto de partida útil y ayudar a establecer conexiones y a ver oportunidades. También puede ayudarlo a ver dónde no tiene sentido invertir tiempo y recursos.

Los otros tres cuadrantes no son lugares en los que deba apresurarse a encontrar usos para las herramientas de IA generativa. Cuando la demanda es baja, hay poca motivación para que la gente utilice o desarrolle la tecnología. Producir haikus al estilo de un pirata de Shakespeare puede hacernos reír y quedarnos boquiabiertos hoy en día, pero esos trucos de fiesta no mantendrán nuestra atención durante mucho más tiempo. Y en los casos en que haya demanda pero haya un alto riesgo, la inquietud general y la regulación retrasarán el ritmo del progreso. Teniendo en cuenta su propia matriz de 2 × 2, puede dejar de lado los usos que figuran allí por el momento.

El bajo riesgo sigue siendo un riesgo

Una leve advertencia: incluso en el aprendizaje corporativo, donde, como hemos argumentado, el riesgo es bajo, existe un riesgo. La IA generativa sigue siendo vulnerable a sesgo y errores, igual que los humanos. Si asume que los resultados de un sistema de IA generativa están listos para funcionar y los distribuye inmediatamente entre toda su fuerza laboral, el riesgo es de sobra. Se pondrá a prueba su capacidad para lograr el equilibrio adecuado entre velocidad y calidad.

Así que tome la salida inicial como primera iteración. Mejore con uno o dos prompt más detallados. Y luego modifique esa salida usted mismo, añadiendo el conocimiento, los matices, incluso el arte y el humor del mundo real que, durante un poco más de tiempo, solo tiene un humano.

Deja una respuesta
Related Posts