DeepSeek acelera la carrera de la IA

Ciudad de México, enero 28.- Las acciones de la industria tecnológica cayeron. Empresas gigantes como Meta y Nvidia se enfrentaron a un aluvión de preguntas sobre su futuro. Los ejecutivos tecnológicos se lanzaron a las redes sociales para proclamar sus temores. Y todo por culpa de una empresa china de inteligencia artificial (IA) poco conocida llamada DeepSeek. DeepSeek causó conmoción en todo el mundo el lunes porque uno de sus logros —haber creado un modelo de IA muy potente con mucho menos dinero del que muchos expertos en IA creían posible— suscitó multitud de preguntas, entre ellas si las empresas estadounidenses siquiera eran competitivas en IA. Los mercados han comenzado a descontar en los precios un futuro en el cual la IA será más barata y más accesible de lo que se esperaba. DeepSeek ha demostrado que es posible producir una IA de última generación con menos chips (y menos potentes), menos energía y mucha menos inversión. Cuanto menos dinero necesiten gastar las empresas en la infraestructura de la IA, más rentables serán. Para tomar en cuenta: Mientras que Nvidia perdió 600 mil mdd de valor de mercado en un solo día, por ejemplo, Apple ganó más de 100 mil mdd. Beneficios en puerta: Lo que perjudica a las empresas que venden infraestructura para IA probablemente beneficie a las que la compran. Según expertos, el enfoque ágil y de bajo costo ha democratizado la IA y ha alentado la competencia. Esto beneficiaría también a startups y actores europeos al reducir barreras de entrada. Sin embargo, podría provocar tensiones geopolíticas. Se fomentaría la innovación de modelos pequeños, abiertos y específicos, reduciendo la dependencia de infraestructuras masivas y expandiendo el acceso global a la IA. La regulación ética y la capacitación en el uso correcto de IA serán clave. Lo que están diciendo: "Si todavía crees que la IA será un gran avance, estas noticias de China sólo deberían hacerte sentir mejor", dijo la firma Siebert. ¿Qué es DeepSeek? DeepSeek es una empresa emergente fundada por High-Flyer, una firma china de comercio bursátil. Su objetivo es crear tecnologías de IA similares al chatbot ChatGPT de OpenAI o al Gemini de Google. Ya en 2021, DeepSeek había adquirido miles de chips informáticos del fabricante estadounidense Nvidia, que son una parte fundamental de cualquier esfuerzo por crear potentes sistemas de IA. En China, la compañía es conocida por captar a talentosos jóvenes investigadores de IA en las mejores universidades, prometiéndoles salarios elevados y la oportunidad de trabajar en proyectos de investigación de vanguardia. Tanto High-Flyer como DeepSeek están dirigidas por Liang Wenfeng, un empresario chino. En los últimos años, DeepSeek ha publicado varios modelos lingüísticos de gran tamaño, que es el tipo de tecnología en el que se basan chatbots como ChatGPT y Gemini. El 10 de enero, lanzó su primera aplicación gratuita de chatbot, basada en un nuevo modelo llamado DeepSeek-V3. ¿Por qué ha reaccionado el mercado de valores? Cuando DeepSeek presentó su modelo DeepSeek-V3 el día después de Navidad, igualaba las capacidades de los mejores chatbots de empresas estadounidenses como OpenAI y Google. Solo eso ya habría sido impresionante. Pero el equipo que está detrás del nuevo sistema también reveló un avance mayor. En un documento de investigación en el que explica cómo desarrolló la tecnología, DeepSeek dijo que solo utilizó una fracción de los chips informáticos en los que se basan las principales empresas de IA para entrenar sus sistemas. Las principales compañías del mundo suelen entrenar a sus chatbots con supercomputadoras que utilizan hasta 16.000 chips o más. Los ingenieros de DeepSeek dijeron que solo necesitaron unos 2000 chips de Nvidia. ¿Cómo creó DeepSeek su tecnología con menos chips de IA? Los mejores ingenieros de IA de Estados Unidos afirman que el documento de investigación de DeepSeek exponía métodos inteligentes e impresionantes de construir tecnología de IA con menos chips. En resumen, los ingenieros de la empresa emergente demostraron una manera más eficaz de analizar los datos utilizando los chips. Los principales sistemas de IA aprenden sus habilidades detectando patrones en enormes cantidades de datos, como texto, imágenes y sonidos. DeepSeek describió una forma de repartir este análisis de datos entre varios modelos especializados de IA —lo que los investigadores llaman un método de “mezcla de expertos”—, minimizando a la vez el tiempo perdido al trasladar los datos de un lugar a otro. Otros han utilizado métodos similares antes, pero mover la información entre los modelos tendía a reducir la eficacia. DeepSeek lo hizo de un modo que le permitía utilizar menos potencia de cálculo. En fin, la carrera inició, igual que cuando evolucionaron los semiconductores.