Humanos versus máquinas: desenredando las tareas que la IA puede (y no puede) manejar

foto-resumen

Por Rachel Layne Saber cuándo utilizar la inteligencia artificial y cuándo confiar en la mente humana es una línea muy fina y cambiante, delineada por una nueva investigación que muestra beneficios y velocidad considerables de la IA generativa, si se aplica a las tareas correctas. Lo que las empresas necesitan saber de un estudio sobre cómo trabajan 750 empleados de Boston Consulting Group con IA: todavía se necesitan humanos para tomar esa decisión. Para poner en funcionamiento la IA con éxito, los gerentes deben seleccionar cuidadosamente sus aplicaciones, capacitar a los trabajadores en su uso adecuado y avanzar rápidamente a medida que la IA mejora. Un equipo multidisciplinario que incluía a varios profesores de la Escuela de Negocios de Harvard trabajó en estrecha colaboración con BCG para probar la IA en simulaciones del mundo real. Descubrieron que los consultores que utilizan IA completan ciertos tipos de tareas más rápido, con resultados que son un 40 por ciento más altos en calidad (aunque la IA puede de alguna manera sofocar la diversidad de sus ideas). Pero en tareas más complejas, los consultores que utilizaban IA tenían 19 puntos porcentuales menos de probabilidades de dar la respuesta correcta. Cómo saber qué tareas se encuentran en qué lado de esa “frontera tecnológica irregular” requiere “estudiarla con su gente, profundamente en su contexto”, explica Edward McFowland III, profesor asistente de la Escuela de Negocios de Harvard y uno de los autores del estudio. "El desafío en este momento es que esto es completamente nuevo. Las empresas no pueden simplemente ignorar estas herramientas, porque tienen un valor tremendo que sus competidores explotarán. Sin embargo, dejarlas libres en todos los casos de uso puede tener una serie de consecuencias perjudiciales. Por lo tanto, Las organizaciones necesitan una mentalidad experimental en la que implementen un enfoque metódico de prueba y aprendizaje". Los hallazgos tienen amplias implicaciones sobre cómo piensan las empresas sobre el uso de la IA y los matices de sus límites. Desde que ChatGPT debutó hace un año, las esperanzas y los temores de la automatización (anteriormente limitados a las fábricas y las líneas de caja de los supermercados) han sacudido las filas de los trabajadores del conocimiento altamente educados y han brindado nuevas vías para un crecimiento explosivo. El equipo de investigación también incluye a Karim Lakhani, profesor de administración de empresas Dorothy y Michael Hintze en HBS, y Fabrizio Dell'Acqua, investigador postdoctoral en HBS. A ellos se suman François Candelon, Lisa Krayer y Saran Rajendran de Boston Consulting Group; Ethan Mollick de la Escuela Wharton de la Universidad de Pensilvania; Katherine Kellogg de la Sloan School of Management del MIT y Hila Lifshitz-Assaf de la Warwick Business School. Integrado dentro de una consultora multinacional Los investigadores probaron cómo 758 consultores (alrededor del 7 por ciento de la fuerza laboral de consultoría de contribuyentes individuales de BCG) realizaron tareas altamente calificadas con y sin IA. Después de establecer una línea de base de desempeño, los consultores se dividieron aleatoriamente en dos grupos. El primer grupo “conceptualizaría y desarrollaría nuevas ideas de productos, centrándose en aspectos como la creatividad, las habilidades analíticas, la persuasión y las habilidades de escritura”, explica el estudio. El segundo se dedicaría a “tareas de resolución de problemas empresariales utilizando datos cuantitativos, entrevistas con clientes y empresas, y un componente de redacción persuasiva”. Los experimentos representan actividades típicas de los consultores; algunas situaciones reflejadas que la empresa utiliza para seleccionar a los solicitantes de empleo, que a menudo tienen doctorados. Dentro de cada grupo, algunos consultores no tenían acceso a la IA, otros usaban GPT-4 solo, mientras que a otro grupo se le dio GPT-4 y algo de capacitación sobre cómo usarlo. Gracias a que los autores se asociaron con BCG, pudieron observar cada interacción y evaluarla con especificidad, hasta cada respuesta, señala McFowland. Donde sobresale la IA: diseñar un zapato La primera mitad de los consultores abordó una serie de 18 tareas seleccionadas para existir "dentro de la frontera" de lo que ChatGPT puede hacer bien. Se les pidió que imaginaran que trabajaban en la división de desarrollo de una empresa de calzado y que idearan un nuevo producto. Los consultores tuvieron que generar 10 ideas, describir un prototipo y considerar al menos cuatro conceptos y por qué se eligió el concepto final. También se les pidió que escribieran un ensayo de 2.500 palabras tipo Harvard Business Review para describir el proceso. Los resultados: los consultores que utilizaron IA terminaron un 12 por ciento más de trabajo a un ritmo un 25 por ciento más rápido que sus homólogos que no utilizaron IA. Y el uso de la IA dio el mayor impulso a los consultores que anteriormente estaban clasificados por debajo de la mediana en un desempeño relacionado previo a la tarea. La IA ayudó a mejorar el rendimiento del grupo de gama baja en un 43 por ciento en comparación con puntuaciones anteriores. Para los artistas mejor calificados, esa cifra fue del 17 por ciento. "Todavía hay una distribución de habilidades (entre los trabajadores del conocimiento) y la pregunta es cómo ayudarlos a trabajar de manera efectiva con la IA", explica McFowland. “Las personas en la mitad inferior de esa distribución tuvieron un aumento de productividad mucho mayor. Pero, en promedio, a todos parece irles mejor”. Sin embargo, sorprendentemente, dice McFowland, ciertas soluciones que utilizan IA arrojaron una variedad más limitada de respuestas, lo que sugiere una posible asfixia del pensamiento creativo que requiere más estudio. "Se pueden imaginar muchas industrias y muchos contextos donde la variedad y la diversidad de ideas son realmente importantes", afirma. “Ahora bien, puede haber respuestas sobre cómo aumentar la variedad [de respuestas], pero la observación y documentación de la existencia de este fenómeno y sus implicaciones es fascinante. Hablamos mucho sobre los aumentos de productividad que aporta este tipo de herramientas. Pero ahora también estamos descubriendo algunas de las consecuencias imprevistas”. Donde la IA tiene problemas: "Acciones tácticas" La tarea de evaluación “fuera de la frontera” implicó la resolución de problemas más complejos. Los investigadores diseñaron una tarea "en la que los consultores sobresaldrían, pero la IA tendría dificultades sin una orientación exhaustiva", explica el artículo. Los consultores de BCG de este grupo primero tuvieron que comprender los canales de distribución de una empresa, que incluían franquicias, tiendas de propiedad exclusiva y tiendas en línea, aconsejar en cuál centrarse para aumentar las ganancias y ofrecer “acciones tácticas” para mejorar las ganancias a través de ese canal. Luego se les pidió que evaluaran las tres marcas de una empresa (para hombres, mujeres o niños) con miras a impulsar el crecimiento de los ingresos. Utilizando hojas de cálculo y entrevistas, se pidió a los consultores que escribieran una breve nota al director ejecutivo de la empresa exponiendo los fundamentos de sus sugerencias. Las instrucciones decían a los consultores que fueran creativos y que "se sintieran libres de confiar en su propio criterio comercial" al hacer sus recomendaciones. Aquí, los humanos superaron a la IA por amplios márgenes. Los consultores que utilizaron IA más capacitación experimentaron una disminución de 24 puntos porcentuales en las respuestas correctas en comparación con sus pares que no usaron IA, y aquellos que usaron IA sola vieron una caída de 13 puntos porcentuales. Lecciones del primer año de la IA Entonces, ¿cómo pueden las empresas basadas en el conocimiento utilizar bien la IA sin salirse de la frontera para sofocar la creatividad o arriesgarse a obtener resultados incorrectos? Para organizaciones: apóyese en el aprendizaje Ir más allá de si adoptar o no la IA . En lugar de eso, decida qué tareas específicas se beneficiarían y permanezca dentro de esos límites. Asóciese con académicos u otros expertos para ayudar a diseñar una evaluación . Los expertos pueden "ayudar a diseñar un estudio para probarlos en su contexto y ver qué está sucediendo", dice McFowland. Una vez que decida utilizarlo, capacite a sus trabajadores para que lo utilicen correctamente . "Con cualquier tecnología nueva surge la necesidad de capacitación, la necesidad de que la gente la use de la manera correcta y evite los obstáculos", dice McFowland. Para los trabajadores: ¿eres un centauro o un cyborg? Los consultores que utilizaron la IA con mayor eficacia se comportaron como "cyborgs" o "centauros", según la investigación. Los centauros, que llevan el nombre del animal mitad caballo y mitad humano de la mitología griega, dividen las tareas entre la IA y ellos mismos. Pudieron "discernir qué tareas son más adecuadas para la intervención humana y cuáles pueden ser gestionadas eficientemente por la IA", explica el artículo. Cyborgs, en referencia a seres ficticios que son en parte humanos, en parte máquinas, e integran tecnología en cada tarea. “Los usuarios de Cyborg no sólo delegan tareas; entrelazan sus esfuerzos con la IA en la frontera misma de las capacidades”, escriben los investigadores. "Esta estrategia podría manifestarse como responsabilidades alternas a nivel de subtarea, como iniciar una oración para que la IA la complete o trabajar en conjunto con la IA".