Llevar los proyectos de aprendizaje automático de la idea a la ejecución
por Eric Siegel

El último y más grande invento de la humanidad se está estancando desde el principio. Los proyectos de aprendizaje automático tienen el potencial de ayudarnos a sortear nuestros riesgos más importantes, incluidos los incendios forestales, el cambio climático, las pandemias y el abuso infantil. Puede impulsar las ventas, reducir los costes, prevenir el fraude, racionalizar la fabricación y reforzar la atención médica.
Pero las iniciativas de aprendizaje automático de forma rutinaria no entrega las devoluciones — o no se despliega por completo. Se detienen antes de desplegarse y tienen un coste elevado. Uno de los principales problemas es que las empresas tienden a centrarse más en la tecnología que en la forma en que debe desplegarse. Es como estar más entusiasmado con el desarrollo de un cohete que con su lanzamiento.
En este artículo, ofrezco un antídoto: una práctica de seis pasos para llevar los proyectos de aprendizaje automático desde la concepción hasta la implementación, que yo llamo BizML. Este marco es un esfuerzo por establecer una guía actualizada y estándar del sector para ejecutar proyectos de aprendizaje automático con éxito que sea pertinente y convincente tanto para los profesionales de negocios como para los profesionales de los datos.
Cambiar un enfoque fuera de lugar: de la tecnología al despliegue
El problema de ML está en su popularidad. A pesar de todo el alboroto sobre la tecnología principal, a menudo se pasan por alto los detalles de cómo su despliegue mejora las operaciones empresariales. De esta manera, ML está ahora demasiado de moda para su propio bien. Tras décadas consultando y organizando conferencias de aprendizaje automático, la lección ha aprendido.
El de hoy bombo publicitario sobre el aprendizaje automático es demasiado entusiasta porque alimenta una idea errónea común: la falacia del aprendizaje automático. Es así: dado que los algoritmos de aprendizaje automático pueden generar con éxito modelos que aguantan situaciones nuevas e invisibles (lo cual es a la vez sorprendente y cierto), sus modelos son intrínsecamente valiosos (lo que no es necesariamente cierto). El valor del ML solo se produce cuando genera un cambio organizacional, es decir, cuando se implementa un modelo generado por ML para mejorar activamente las operaciones. Hasta que una modelo sea usado para remodelar activamente el funcionamiento de su organización, es sin uso — literalmente. Un modelo no resuelve ningún problema empresarial por sí solo y no se va a implementar solo. El aprendizaje automático puede ser la tecnología disruptiva que parece ser, pero solo si se logra generar disrupción con ella.
Por desgracia, las empresas suelen no logra cerrar la «brecha cultural» empresarial y tecnológica, una desconexión entre los científicos de datos y las partes interesadas empresariales que impide el despliegue y hace que los modelos acumulen polvo. Por un lado, los científicos de datos, que llevan a cabo la etapa de desarrollo del modelo, se obsesionan únicamente con la ciencia de los datos y, por lo general, prefieren que no les molesten las actividades de gestión «mundanas». A menudo, dan por sentado el despliegue de su modelo y se saltan un riguroso proceso empresarial que implicaría a las partes interesadas planificar el despliegue de forma colaborativa.
Por otro lado, muchos profesionales de negocios —especialmente los que ya se inclinan a renunciar a los detalles por ser «demasiado técnicos» — se han dejado seducir por ver esta impresionante tecnología como una panacea que resuelve los problemas por sí sola. Se remiten a los científicos de datos para cualquier proyecto específico. Pero cuando, en última instancia, se enfrentan al cambio operativo en el que incurriría un modelo desplegado, es difícil de vender. Tomado con la guardia baja, el stakeholder duda antes de modificar las operaciones que son clave para la rentabilidad de la empresa.
Sin que nadie asuma la propiedad proactiva, la manguera y el grifo no se conectan. Con demasiada frecuencia, el científico de datos ofrece un modelo viable, pero el equipo operativo no está preparado para el pase y deja caer la pelota. Hay maravillosas excepciones y éxitos brillantes , pero la mala trayectoria general que presenciamos hoy advierte de una amplia desilusión con el aprendizaje automático, incluso un temido Invierno de IA.
La solución: BizML
La solución es ser rigurosamente plan de despliegue desde el inicio de cada proyecto de aprendizaje automático. Sentar las bases para el cambio operativo que el despliegue llevaría a buen término requiere más predicación, socialización, colaboración interdisciplinaria, y estilo de gestión del cambio de lo que muchos, incluido yo, nos dimos cuenta inicialmente.
Para lograrlo, un equipo bien informado debe colaborativamente seguir una práctica de principio a fin que comience con la planificación retrospectiva del despliegue. Como he mencionado anteriormente, llamo a esta práctica BizML y se compone de los seis pasos siguientes.
1. Establecer el objetivo de despliegue.
Defina la propuesta de valor empresarial: cómo afectará el aprendizaje automático a las operaciones para mejorarlas (es decir, operacionalización o implementación).
Ejemplo: UPS predice qué direcciones de destino recibirán la entrega de un paquete para planificar un proceso de entrega más eficiente.
2. Establecer el objetivo de predicción.
Defina lo que predecirá el modelo de aprendizaje automático para cada caso individual. Cada detalle importa desde una perspectiva empresarial.
Ejemplo: Para cada destino, ¿cuántos paquetes en cuántas paradas se necesitarán mañana? Por ejemplo, un grupo de tres edificios de oficinas con 24 suites de negocios en 123 Main St. Necesitará dos paradas con tres paquetes cada una antes de las 8:30 de la mañana.
3. Establezca las métricas de evaluación.
Determine los puntos de referencia más importantes a seguir durante el entrenamiento y el despliegue de modelos y determine qué nivel de rendimiento debe alcanzarse para que el proyecto se considere un éxito.
Ejemplos: millas recorridas, galones de combustible consumidos, toneladas de carbono emitidas y paradas por milla (cuanto más densas sean las entregas en una ruta, más valor se genera por cada milla de conducción).
4. Prepare los datos.
Defina el aspecto que deben tener los datos de entrenamiento y póngalos en ese formulario.
Ejemplo: Reúna un gran número de ejemplos positivos y negativos de los que aprender, tanto destinos que sí recibieron entregas ciertos días como otros que no.
5. Entrene a la modelo.
Genere un modelo predictivo a partir de los datos. El modelo es lo que se «aprende».
Ejemplos: árboles de decisión, regresión logística, redes neuronales y modelos de conjuntos.
6. Despliegue el modelo.
Utilice el modelo para obtener puntuaciones predictivas (probabilidades) (aplicando así lo aprendido a los nuevos casos) y, a continuación, actúe en función de esas puntuaciones para mejorar las operaciones empresariales.
Ejemplo: Al contabilizar los paquetes previstos junto con los paquetes conocidos, UPS mejoró su sistema que asigna los paquetes a los camiones de reparto en los centros de envío. Esta mejora anual ahorra aproximadamente 18,5 millones de millas, 35 millones de dólares, 800 000 galones de combustible y 18 500 toneladas métricas de emisiones.
Estos seis pasos definen una práctica empresarial que traza un camino astuto hacia el despliegue del aprendizaje automático. Cualquier persona que quiera participar en proyectos de aprendizaje automático debe estar familiarizada con ellos, sin importar si desempeña un puesto empresarial o técnico.
Tras culminar con el paso 6, el despliegue, ha terminado… de empezar algo nuevo. BizML solo comienza un viaje continuo, una nueva fase de mejora de las operaciones y de mantener las cosas funcionando. Una vez lanzado, un modelo necesita mantenimiento: supervisarlo, mantenerlo y actualizarlo periódicamente.
Seguir estos seis pasos en este orden es casi una inevitabilidad lógica. Para entender por qué, empecemos por el final. Los dos últimos pasos finales, los pasos 5 y 6, son los dos pasos principales del aprendizaje automático, el entrenamiento del modelo y el despliegue. BizML lleva el proyecto a su finalización.
El paso justo antes de esos dos, el paso 4: preparar los datos, es un requisito conocido que siempre precede al entrenamiento de modelos. Debe proporcionar al software de aprendizaje automático los datos en la forma correcta para que funcione. Ese paso siempre ha sido una parte integral de los proyectos de modelización, desde que las empresas aplicaron la regresión lineal por primera vez en la década de 1960.
Antes de la magia técnica, debe hacer magia empresarial. Ahí es donde entran los tres primeros pasos. Establecen una fase de «preproducción» muy necesaria de presentación, socialización y colaboración para acordar conjuntamente cómo se desplegará el aprendizaje automático y cómo se evaluará su rendimiento. Es importante destacar que estos primeros pasos van mucho más allá de ponerse de acuerdo sobre el objetivo empresarial de un proyecto. Piden a los profesionales de negocios que estudien la mecánica que define exactamente cómo las predicciones alteran las operaciones, y piden a los científicos de datos que vayan más allá de su ámbito habitual y trabajen en estrecha colaboración con el personal empresarial. Este equipo interdisciplinario está equipado de manera única para elaborar un plan de despliegue que sea tanto técnicamente factible como operacionalmente viable.
Incorporar a las partes interesadas de la empresa al redil
Seguir los seis pasos de la práctica de BizML es poco común, pero no inaudito. Muchos proyectos de aprendizaje automático tienen un gran éxito, aunque sean una minoría. Si bien un marco conocido y establecido ha tardado mucho en llegar, las ideas fundamentales del marco BizML no son nuevas para muchos científicos de datos con experiencia.
Sin embargo, las personas que más lo necesitan —los líderes empresariales y otras partes interesadas de la empresa— tienen menos probabilidades de conocerlo. De hecho, el mundo empresarial en general aún no se ha dado cuenta ni siquiera de la necesidad de un consultorio empresarial especializado en primer lugar. Es comprensible, ya que la narrativa común los lleva por mal camino. La IA se sobrevende a menudo como una panacea impenetrable pero emocionante. Mientras tanto, muchos científicos de datos prefieren con creces calcular números que esforzarse por dilucidarlos.
Lo primero es lo primero: los profesionales de negocios necesitan algo de edificación. Antes de que los responsables puedan participar en la práctica de BizML y, en última instancia, dar luz verde al despliegue del modelo con confianza, deben obtener una comprensión concreta de cómo funciona un proyecto de aprendizaje automático de principio a fin:¿Qué predecirá el modelo? Exactamente, ¿cómo afectarán esas predicciones a las operaciones? ¿Qué métrica mide de manera significativa lo bien que predice? y_¿Qué tipo de datos se necesitan?_ Esta no es la parte de «ciencia espacial», pero aun así vale un libro modesto.
Teniendo en cuenta los innumerables dólares y recursos que se invierten en el aprendizaje automático, ¿cuánto más valor potencial podríamos obtener adoptando un procedimiento universal que facilite la colaboración y la planificación necesarias para llegar al despliegue? Vamos a averiguarlo.
Este artículo es una adaptación del libro, El manual de estrategias de la IA: Dominar el raro arte del despliegue del aprendizaje automático, con el permiso de la editorial, MIT Press. Es producto del trabajo del autor cuando ocupó un puesto de un año como profesor de Análisis Corporal del Bicentenario en la Escuela de Negocios Darden de la UVA.
Artículos Relacionados

La IA es genial en las tareas rutinarias. He aquí por qué los consejos de administración deberían resistirse a utilizarla.

Investigación: Cuando el esfuerzo adicional le hace empeorar en su trabajo
A todos nos ha pasado: después de intentar proactivamente agilizar un proceso en el trabajo, se siente mentalmente agotado y menos capaz de realizar bien otras tareas. Pero, ¿tomar la iniciativa para mejorar las tareas de su trabajo le hizo realmente peor en otras actividades al final del día? Un nuevo estudio de trabajadores franceses ha encontrado pruebas contundentes de que cuanto más intentan los trabajadores mejorar las tareas, peor es su rendimiento mental a la hora de cerrar. Esto tiene implicaciones sobre cómo las empresas pueden apoyar mejor a sus equipos para que tengan lo que necesitan para ser proactivos sin fatigarse mentalmente.

En tiempos inciertos, hágase estas preguntas antes de tomar una decisión
En medio de la inestabilidad geopolítica, las conmociones climáticas, la disrupción de la IA, etc., los líderes de hoy en día no navegan por las crisis ocasionales, sino que operan en un estado de perma-crisis.