Por Michael Osborne Profesor de Aprendizaje Automático y Carl-Benedikt Frey es el Profesor Asociado Dieter Schwarz En 2013, publicamos un artículo titulado "El futuro del empleo: ¿Qué tan susceptibles son los empleos a la informatización?", estimando que el 47% de los empleos de EE. UU. están en riesgo de automatización. Desde entonces, han surgido numerosos estudios que han llegado a conclusiones muy diferentes. En particular, un estudio publicado por un grupo de investigadores de la Universidad de Mannheim sugiere que solo el 9% de los puestos de trabajo están expuestos a la automatización. Y más recientemente, un estudio de la OCDE sugiere que en realidad es del 14%, con un "32% adicional de los trabajos tienen un riesgo de entre el 50 y el 70% que apunta a la posibilidad de un cambio significativo en la forma en que se llevan a cabo estos trabajos como resultado de la automatización". Naturalmente, a muchos responsables de la formulación de políticas les resulta difícil dar sentido a estos resultados. ¿Qué estudio es el correcto? ¿Y por qué llegan a conclusiones tan diferentes? En este artículo, trataremos de explicar por qué estas estimaciones divergen. A pesar de todas sus diferencias, estos estudios se basan en la misma intuición. Esto es que el futuro del trabajo se puede inferir observando lo que hacen las computadoras. Y hay buenas razones para creer que este punto de vista es correcto. En 2003, David Autor, Frank Levy y Richard Murnane, del Instituto Tecnológico de Massachusetts (MIT), demostraron que los trabajos intensivos en tareas rutinarias habían desaparecido desde 1980. Sus hallazgos eran totalmente predecibles. En su ensayo de 1960, "The Corporation: Will It Be Managed by Machines?", Herbert Simon predijo el declive de los trabajos rutinarios, argumentando que las computadoras tienen la ventaja comparativa en las actividades "rutinarias" basadas en reglas que son fáciles de especificar en el código informático. A través de una serie de estudios de caso en 1960, la Oficina de Estadísticas Laborales de los Estados Unidos (BLS, por sus siglas en inglés) también llegó a una conclusión similar, sugiriendo que: Un poco más del 80% de los empleados afectados por el cambio estaban en trabajos rutinarios que implicaban publicar, verificar y mantener registros; limado; informática; o tabulación, perforación de teclas y operaciones de máquina relacionadas. A pesar de sus conocimientos precisos, Simon y el BLS fueron lo suficientemente cuidadosos como para no proporcionar una línea de tiempo sobre cuánto tiempo pasaría antes de que los trabajos rutinarios desaparecieran en grandes cantidades. Y tampoco lo hicimos en 2013. Nuestro estudio ni siquiera fue una predicción. Se trataba de una estimación de la exposición de los puestos de trabajo existentes a los recientes avances en inteligencia artificial y robótica móvil. No dijo nada sobre el ritmo al que se automatizarán los puestos de trabajo. Lo que sí sugiere es que el 47% de los puestos de trabajo son automatizables desde el punto de vista de las capacidades tecnológicas. Como señalábamos entonces: Nos centramos en estimar la proporción del empleo que potencialmente puede ser sustituido por capital informático, desde el punto de vista de las capacidades tecnológicas, durante un número no especificado de años. No intentamos estimar cuántos trabajos se automatizarán realmente. El alcance y el ritmo reales de la informatización dependerán de varios factores adicionales que no se han tenido en cuenta. A menudo se ha interpretado que nuestras estimaciones implican un apocalipsis del empleo. Sin embargo, eso no es lo que pretendíamos o sugeríamos. Todo lo que mostramos es que el alcance potencial de la automatización es enorme, tal como lo fue en vísperas de la Segunda Revolución Industrial, antes de que la electricidad y el motor de combustión interna hicieran que muchos de los trabajos que existían en 1900 fueran redundantes. Si nuestros bisabuelos hubieran intentado hacer una evaluación similar a principios del siglo XX, probablemente habrían llegado a una cifra similar. En 1900, más del 40% de la fuerza laboral estaba empleada en la agricultura. Ahora es menos del 2%. Visto a través de la lente del siglo XX, nuestra estimación, de que el 47% de los puestos de trabajo están expuestos a la automatización futura, no parece extraordinariamente alta. Por el contrario, las estimaciones de la Universidad de Mannheim y de la OCDE parecen extremadamente bajas. Ambos estudios parten de nuestra metodología, así que comencemos con una descripción no técnica de la misma. En 2013, reunimos a un grupo de expertos en aprendizaje automático para evaluar la capacidad de automatización de 70 ocupaciones utilizando descripciones detalladas de tareas. En concreto, pedimos a los expertos que evaluaran si cada tarea para estas ocupaciones era automatizable, dada la disponibilidad de equipos informáticos de última generación y condicionada a la disponibilidad de big data relevante para que el algoritmo se basara. Los datos se obtuvieron de O*Net que, a través de encuestas a la población activa, ha recopilado unas 20.000 descripciones únicas de tareas junto con datos sobre las habilidades, conocimientos y habilidades que poseen las diferentes ocupaciones. Este tipo de "big data" viene con un problema nada desdeñable: el cerebro humano tiene dificultades para procesarlo. Pero, afortunadamente, vivimos en la era de la IA. Y la IA realizó la mayor parte de nuestro análisis. El papel de los expertos era proporcionarnos lo que los investigadores de aprendizaje automático llaman un "conjunto de datos de entrenamiento", lo que permite a nuestro algoritmo aprender sobre las características de los trabajos automatizables frente a los no automatizables. Si bien las descripciones de tareas proporcionadas para cada ocupación en O*Net son únicas, O*Net también proporciona un conjunto de características comunes para todas las ocupaciones, que también se derivan de encuestas, durante las cuales se pregunta a los trabajadores con qué frecuencia participan en actividades particulares, como cuidar a los clientes, negociar, desarrollar ideas y artefactos novedosos. Estas características permitieron a nuestro algoritmo conocer las características de las ocupaciones automatizables y no automatizables, lo que a su vez nos permitió predecir la automatizabilidad de otras 632 ocupaciones. Así, pudimos examinar un total de 702 ocupaciones, que en 2013 representaban el 97% de la fuerza laboral de Estados Unidos. El uso de la IA para nuestro análisis tuvo beneficios más allá del ahorro de tiempo y mano de obra. Entre las ocupaciones que los expertos consideraron no automatizables se encuentran las de camareros y camareras. Sin embargo, nuestro algoritmo de IA nos dio otra respuesta. Al examinar las similitudes entre las tareas realizadas por los camareros y las de otras profesiones, sugirió que los trabajos de los camareros son, de hecho, automatizables. Y se demostró que tenía razón: en 2016 abrió la cadena de restaurantes Eatsa, completamente sin camareros. Por supuesto, los algoritmos son tan buenos como los datos que les proporcionamos, y nuestro enfoque tenía un inconveniente. Como señalamos en el documento, si bien "nuestras estimaciones de probabilidad describen la probabilidad de que una ocupación esté completamente automatizada, no capturamos ninguna variación dentro de la ocupación [...]". Lo que queremos decir con esto es que detrás de nuestro análisis había un conjunto de características específicas de la ocupación. Pero cada ocupación emplea a miles de personas, de las cuales algunas realizan tareas ligeramente diferentes. Este fue también el punto que recogieron los autores del estudio de Mannheim y de la OCDE, aunque la variación dentro de la ocupación probablemente desempeñe un papel menor: el trabajo de un taxista o un cajero, por ejemplo, es esencialmente el mismo en todas las empresas y lugares. Sin embargo, al utilizar datos individuales en lugar de datos a nivel ocupacional, lo que les permite capturar también la variación dentro de la ocupación, este enfoque tiene sus méritos. Sin embargo, tenemos una serie de otras consultas con respecto a estos estudios. Lo que todos los estudios anteriores tienen en común, incluido nuestro estudio, es que infieren la automatizabilidad de los puestos de trabajo mediante el análisis de sus tareas. Si bien el estudio de Mannheim parece adoptar un enfoque basado en tareas, una mirada más cercana a las variables que se utilizan muestra que este no es el caso. En lugar de basarse principalmente en las tareas, el estudio de Mannheim utiliza las características de los trabajadores y las empresas, así como variables demográficas como el sexo, la educación, la edad y los ingresos. Según este enfoque, cuanto más gana un contador, menos automatizable es su trabajo. Si él o ella tiene un doctorado en sociología, el trabajo está más seguro de la automatización. Del mismo modo, una mujer taxista con un doctorado tiene menos probabilidades de ser desplazada por un coche autónomo que un hombre que ha estado conduciendo un taxi durante décadas. Sin embargo, ¿por qué debería la automatización discriminar en función de las características de los trabajadores? En 2013, observamos que los trabajadores que estaban empleados en trabajos expuestos a la automatización tienden a tener niveles más bajos de educación y (típicamente) ingresos más bajos. Y también observamos que un número desproporcionado de mujeres trabaja en ocupaciones que están menos expuestas a la automatización en comparación con los hombres. El estudio de Mannheim, sin embargo, utiliza estos resultados como insumos para su análisis. De hecho, los puestos de trabajo no están más o menos expuestos por el sexo del trabajador, aunque algunos trabajos más dominados por los hombres están más expuestos a la automatización. El estudio de la OCDE no comete el mismo error: no incluye variables demográficas, lo que podría explicar por qué encuentra una mayor proporción de empleos expuestos a la automatización. Sugiere que entre el 6% (en Noruega) y el 33% (en Eslovaquia) de los puestos de trabajo son automatizables en los países de la OCDE. Si bien su cifra principal sugiere que solo el 14% de los trabajos en estos países son automatizables, utilizando nuestra definición, su estimación de automatizabilidad media es bastante alta: se estima que el trabajo medio tiene un 48% de probabilidad de ser automatizado. Al igual que el estudio de Mannheim, la OCDE utiliza datos a nivel individual de la encuesta PIAAC, lo que, según ellos, explica por qué encuentran un menor porcentaje de trabajos automatizables, en relación con nuestra estimación. Sin embargo, no aportan ninguna prueba que demuestre realmente que este sea el caso. Para tomar el ejemplo del conductor de camión, nuestro enfoque trata a todos los conductores de camiones como iguales: cuando lleguen los vehículos autónomos, todos estarán expuestos a la automatización. El estudio de la OCDE sostiene que sus estimaciones son inferiores a las nuestras porque una gran parte de los conductores no se encontrarán expuestos pero sin aportar ningún dato que demuestre que es así. Acogeríamos con beneplácito la publicación por parte de la OCDE de la distribución de los trabajadores expuestos a la automatización por ocupación. Nos resulta difícil creer que las tareas realizadas por los diferentes conductores de camiones (o trabajadores de cualquier otra ocupación) varíen tanto. Nos resulta aún más difícil creer que esto explique una asombrosa diferencia entre el 14% y el 47% que está expuesto a la automatización. Y lo que es más importante, incluso si hay una variación en las tareas que se realizan dentro de las ocupaciones, ¿no se esperaría que las empresas simplificaran las tareas de producción para poder aprovechar la nueva tecnología? Por ejemplo, dependiendo de las condiciones del suelo y del clima, los trabajadores agrícolas en 1900 habrán realizado tareas ligeramente diferentes. Pero en el mundo desarrollado, casi todos ellos finalmente adoptaron el tractor después de su llegada. Dado que la única fuente de datos que ambos estudios consideran sobre la automatizabilidad es nuestro conjunto de entrenamiento, la única forma razonable de comprobar cuál de sus modelos y nuestro modelo es preferible es qué tan bien se desempeña en ese conjunto de entrenamiento. Una forma común de evaluar dicho desempeño es "retener" (ocultar) elementos del conjunto de entrenamiento proporcionado al modelo: más tarde, las predicciones del modelo para estas ocupaciones no vistas se pueden comparar con sus valores reales. Una métrica utilizada con frecuencia para evaluar esto es el AUC, que es la única métrica comparable calculada para ambos estudios. Según esta medida, el modelo no lineal de nuestro estudio es sustancialmente más preciso (en la predicción de los miembros del conjunto de entrenamiento que se quedan fuera) que el modelo lineal utilizado en el estudio de la OCDE. La distribución bimodal de las puntuaciones de automatizabilidad en nuestro estudio es el resultado de la confianza de nuestro modelo (la mayoría de las ocupaciones se predicen con seguridad como automatizables o no): el hecho de que el modelo prediga en su mayoría correctamente los elementos retenidos del conjunto de formación da peso a esta confianza. Desgraciadamente, de la evidencia del estudio de la OCDE no se desprende claramente que su modelo sea (ni que los resultados que se derivan de él sean) más fiable. Además, si bien nuestro análisis examina 702 ocupaciones, los resultados del estudio de la OCDE se desglosan por categorías ocupacionales amplias. Y como señala acertadamente el estudio de la OCDE, "se pierde información valiosa cuando el riesgo de la automatización se calcula en función de los requisitos de habilidades de amplias categorías ocupacionales". Como el estudio de la OCDE encuentra que el 14% de los trabajos están expuestos a la automatización, es posible que de 2 a 3 ocupaciones impulsen sus resultados por completo. Agradecemos el intento de la OCDE de contribuir a nuestra labor. La razón por la que pusimos nuestros datos a disposición del público es para permitir que otros se basen en ellos. Esta es también la razón por la que la OCDE y la Universidad de Mannheim pudieron ajustar nuestra metodología. Acogeríamos con beneplácito una transparencia similar de estos estudios. Los responsables de la formulación de políticas deben comprender el razonamiento que subyace a las cifras dispares de estos estudios para sacar sus propias conclusiones sobre la magnitud de los cambios a los que nos enfrentamos y, por lo tanto, poder elaborar respuestas adecuadas. ****Michael A. Osborne (DPhil Oxon) es un experto en el desarrollo de la inteligencia artificial en simpatía con las necesidades de la sociedad. Su trabajo en algoritmos de inferencia robustos y escalables en Machine Learning se ha aplicado con éxito. ****Carl-Benedikt Frey es el Profesor Asociado Dieter Schwarz de IA & Trabaja en el Instituto de Internet de Oxford y es miembro del Mansfield College de la Universidad de Oxford. También es Director del Programa del Futuro del Trabajo y Oxford Martin Citi Fellow ****Este artículo de opinión refleja los puntos de vista del autor, y no refleja necesariamente la posición de la Oxford Martin School o de la Universidad de Oxford. Cualquier error u omisión es del autor.