Dos días después del lanzamiento del DeepSeek-R1, ByteDance, la empresa matriz de TikTok, presentó una actualización de su modelo de IA insignia, afirmando que superaba al modelo o1 de OpenAI, respaldado por Microsoft, en AIME, un test de referencia que mide la capacidad de los modelos de IA para comprender y responder a instrucciones complejas.
Esto se hizo eco de la afirmación de DeepSeek de que su modelo R1 rivalizaba con o1 de OpenAI en varias pruebas de rendimiento.
DeepSeek contra sus competidores locales
El modelo predecesor de DeepSeek-V3, el DeepSeek-V2, desató una guerra de precios en el sector de modelos de IA en China tras su lanzamiento en mayo pasado.
El hecho de que DeepSeek-V2 fuera de código abierto y extremadamente económico –con un costo sin precedentes de solo 1 yuan ($0.14) por cada millón de tokens procesados– llevó a la unidad de nube de Alibaba a anunciar recortes de precios de hasta un 97% en una variedad de modelos.
Otras empresas tecnológicas chinas siguieron el mismo camino, incluyendo Baidu (9888.HK), que lanzó el primer equivalente chino de ChatGPT en marzo de 2023, y Tencent (0700.HK), la empresa de internet más valiosa del país.
Liang Wenfeng, el enigmático fundador de DeepSeek, afirmó en una rara entrevista con el medio chino Waves en julio que la startup «no se preocupaba» por las guerras de precios y que su principal objetivo era alcanzar la inteligencia artificial general (AGI, por sus siglas en inglés).
OpenAI define la AGI como sistemas autónomos que superan a los humanos en la mayoría de las tareas económicamente valiosas.
Mientras que grandes empresas tecnológicas chinas como Alibaba cuentan con cientos de miles de empleados, DeepSeek opera como un laboratorio de investigación, conformado principalmente por jóvenes graduados y doctorandos de las principales universidades chinas.
En su entrevista de julio, Liang expresó su creencia de que las mayores empresas tecnológicas chinas podrían no estar bien posicionadas para el futuro de la industria de la IA, contrastando sus altos costos y estructuras jerárquicas con la operación ágil y el estilo de gestión flexible de DeepSeek.
«Los modelos fundacionales requieren innovación continua, y las capacidades de los gigantes tecnológicos tienen sus límites», afirmó.