PathMBA Vault

Analytics and data science

Sacar provecho del aprendizaje automático no se trata de algoritmos más sofisticados, sino de facilitar su uso

por Ben Schreck, Max Kanter, Kalyan Veeramachaneni, Sanjeev Vohra, Rajendra Prasad

Sacar provecho del aprendizaje automático no se trata de algoritmos más sofisticados, sino de facilitar su uso

mar18-06-hbr-juan-diaz-faes-project-tech

juan diaz faes para HBR

El aprendizaje automático puede generar un valor empresarial tangible para una amplia gama de sectores, pero solo si realmente se pone en práctica. A pesar de los numerosos descubrimientos sobre el aprendizaje automático que están haciendo los académicos, de los nuevos trabajos de investigación que muestran lo que es posible y de la creciente cantidad de datos disponibles, las empresas se esfuerzan por implementar el aprendizaje automático para resolver problemas empresariales reales. En resumen, la brecha para la mayoría de las empresas no es que el aprendizaje automático no funcione, sino que se esfuerzan por usarlo realmente.

¿Cómo pueden las empresas cerrar esta brecha de ejecución? En un proyecto reciente ilustramos los principios de cómo hacerlo. Utilizamos el aprendizaje automático para aumentar el poder de los profesionales experimentados (en este caso, los directores de proyectos) al permitirles tomar decisiones empresariales basadas en los datos con mucha antelación. Y al hacerlo, demostramos que sacar provecho del aprendizaje automático se basa menos en modelos de vanguardia y más en facilitar el despliegue.

La IA como director de proyectos

Los proveedores de servicios tecnológicos como Accenture trabajan en varios proyectos de software. Un desafío común al que se enfrentan a menudo es que los problemas problemáticos se descubren después de los hechos, lo que exige una investigación post mortem para determinar la causa raíz. Es una tarea tediosa y puede resultar abrumadora cuando se llevan a cabo cientos de proyectos a la vez. Una solución proactiva ahorraría tiempo y reduciría el riesgo de que los problemas se produjeran en primer lugar. Nuestro equipo decidió abordar este problema encontrando patrones en un volumen de datos complejo, creando modelos de aprendizaje automático y utilizándolos para anticipar la aparición de problemas críticos. Llamamos a nuestro esfuerzo «director de proyectos de IA».

Un director de proyectos de IA actúa como una herramienta de aumento para los directores de proyectos humanos. Con datos históricos de proyectos de software, entrena un modelo basado en el aprendizaje automático para predecir, con semanas de antelación, si es probable que se produzca un problema. Como caso de prueba, decidimos utilizar el modelo de aprendizaje automático que creamos para predecir el rendimiento de los proyectos de software en función de una serie de métricas de entrega.

Entrenar el modelo

Para entrenar este modelo, primero recopilamos datos históricos de los últimos tres años de miles de proyectos, incluidos millones de registros. El modelo identificó señales de alerta que podrían indicar un problema inminente en el rendimiento del proyecto, incluido el aumento del tiempo medio dedicado a resolver un error y el tiempo de procesamiento y resolución de los atrasos. Lo más importante es que pudo predecir los posibles riesgos con antelación, en nuestro caso con cuatro semanas de antelación. Este plazo permite a los equipos de los proveedores de servicios determinar la naturaleza del problema que se avecina, identificar las áreas que se verían afectadas y tomar medidas correctivas para evitar que se produzca. Básicamente, el director de proyectos de IA funcionaba como un sistema de alerta temprana que permitía a los directores de proyectos humanos emprender tareas empresariales más valiosas.

Una vez entregado el modelo, el equipo de despliegue comenzó a aplicarlo a los datos entrantes que antes no había visto el modelo. Tras observar un rendimiento estable a lo largo de varios meses de datos, confiamos en utilizar el modelo en varios proyectos. Actualmente, el director de proyectos de IA (probado e integrado en Accenture Mi mago La plataforma de automatización (en todos los proyectos de entrega) publica predicciones semanalmente y predice correctamente las señales de alerta el 80% de las veces, lo que ayuda a mejorar los KPI relacionados con la entrega de los proyectos.

El siguiente paso del proyecto será utilizar los mismos datos para crear modelos que puedan predecir los sobrecostes, los retrasos en el calendario de entrega y otros aspectos críticos de la ejecución del proyecto que son fundamentales para el rendimiento empresarial de la organización.

Listo Beats Perfect

Mientras creábamos el modelo de aprendizaje automático, nos sorprendió enterarnos de que ninguna de las herramientas de ciencia de datos más promocionadas, como el aprendizaje profundo, el AutoML y la «IA que crea la IA», era necesaria para que funcionara. De hecho, no nos habrían ayudado a alcanzar nuestros objetivos clave. En cambio, nuestros principales requisitos eran una práctica de ingeniería de software sólida, una automatización que permitiera a los expertos en el campo llegar al nivel adecuado y herramientas que pudieran respaldar las pruebas exhaustivas de modelos.

Previendo que otras empresas podrían beneficiarse de estas lecciones, las hemos organizado en un nuevo paradigma de aprendizaje automático, que denominamos ML 2.0. Los pasos clave de este marco son descrito en un artículo de investigación, y cuentan con el apoyo de un conjunto de herramientas de software de código abierto.

Los cuatro aspectos más importantes del nuevo paradigma del aprendizaje automático son los siguientes:

Proceso rápido: El ML 2.0 ayuda a los usuarios a pasar de la representación de datos sin procesar a un modelo desplegado en siete pasos precisos. En consecuencia, un equipo de cuatro personas pudo desarrollar la prueba de concepto e implementar los modelos necesarios en ocho semanas. Esto no habría sido posible con el antiguo paradigma, que exigía costosas adquisiciones, como un software único creado para el descubrimiento y algoritmos complejos cuyo beneficio no se puede cuantificar.

Mayor participación de los expertos en el dominio: Los expertos en el dominio determinaron las variables clave, por ejemplo, qué eventos específicos representaban un riesgo para el rendimiento del proyecto, con qué antelación tenía que esperar el modelo para que la información fuera valiosa y qué proyectos anteriores deberían utilizarse para entrenar el modelo. ML 2.0 proporcionó a los expertos en el dominio un ingeniería de predicción herramienta que les permitía establecer los parámetros clave y garantizar que el modelo generara valor empresarial.

Ingeniería de funciones automatizada: Una parte vital del proceso de aprendizaje automático es la ingeniería de funciones, que implica utilizar el conocimiento del dominio para extraer patrones, o características, a partir de datos sin procesar. Los expertos en el dominio suelen ser mejores que las máquinas a la hora de sugerir patrones que tienen poder predictivo; por ejemplo, un aumento del tiempo medio de respuesta de un ticket podría provocar un rendimiento deficiente del proyecto, pero se necesitan herramientas de software automatizadas para calcular realmente estas características. Solíamos Herramientas de funciones, una biblioteca de código abierto patrocinada por DARPA creada por Laboratorios de largometrajes, donde trabajamos tres. La herramienta recomendaba 40 000 patrones, que los expertos en el campo redujeron a 100 de los más prometedores.

Pruebas inteligentes de modelos: Como la mayoría de los expertos en el campo, los directores de proyectos de software tenían que someter sus nuevos modelos a varias rondas de validación y pruebas en el mundo real antes de tener la confianza suficiente para implementarlos. El conjunto de pruebas automatizadas integrado en el ML 2.0 ofrecía al equipo de despliegue la flexibilidad de simular estados anteriores de los datos, añadir datos que no se habían incluido en el proceso de desarrollo y realizar sus propias pruebas durante varios momentos. Esto incluía las pruebas en tiempo real cuando llegó el momento del despliegue.

La capacidad de anticiparse es una ventaja competitiva

Si las empresas quieren sacar provecho real del aprendizaje automático, tienen que centrarse no solo en la tecnología, sino también en los procesos. Los expertos en aprendizaje automático, por su parte, tienen que darse cuenta de la brecha entre la ciencia de vanguardia y la capacidad de las organizaciones para implementar realmente modelos de trabajo destinados a problemas reales. Cerrar la brecha de implementación requerirá un nuevo enfoque del aprendizaje automático, con muchos problemas técnicos propios interesantes.

El ML 2.0 ayuda a transformar el potencial del aprendizaje automático en resultados empresariales tangibles al situar el aprendizaje automático en el centro de una función empresarial, en lugar de tratarlo como una iniciativa de I+D independiente. Hacerlo influye directamente en la forma en que las organizaciones gestionan sus negocios, en la forma en que pueden crear nuevas fuentes de ingresos, en la forma en que pueden reimaginar sus productos y servicios, en la forma en que pueden aumentar la eficiencia operativa, redefinir su fuerza laboral y mucho más. Hoy en día, las empresas no solo quieren tener respuestas a preguntas como: ¿cumplimos nuestro objetivo de ventas para este trimestre? ¿Llegamos a nuestro público objetivo? ¿Nuestra inversión en publicidad cumplió sus objetivos? En cambio, quieren saber qué es lo que es probable que pase en el futuro. Quieren tomar decisiones predictivas basadas en datos de forma rápida y sencilla, que es lo que promete el aprendizaje automático 2.0.