DeepSeek: El Gigante Silencioso que Lidera la Carrera de la IA en China
DeepSeek, una startup china de IA de bajo perfil, se ha convertido en una fuerza importante, con su modelo R1 superando al de OpenAI en varios puntos de referencia de razonamiento. Totalmente financiada por el fondo de cobertura cuantitativo High-Flyer, DeepSeek prioriza la tecnología fundamental sobre las aplicaciones comerciales, comprometiéndose a hacer sus modelos de código abierto y provocando una guerra de precios en China con sus API asequibles. Esto se impulsa por el acceso a los vastos recursos informáticos de High-Flyer. El objetivo ambicioso de DeepSeek es lograr la Inteligencia Artificial General (AGI), centrándose en innovaciones arquitectónicas y algorítmicas innovadoras como la atención latente de múltiples cabezas (MLA) y la mezcla dispersa de expertos (DeepSeekMoE), reduciendo drásticamente los costos de inferencia. Su éxito se debe a la innovación integral en la arquitectura del modelo y a la utilización eficaz del talento doméstico, contrastando fuertemente con muchas empresas chinas centradas en la comercialización y la replicación. El fundador Liang Wenfeng, un idealista tecnológico, prioriza los principios sobre los beneficios, impulsando la innovación original y con el objetivo de posicionar a China como una contribuyente significativa al avance tecnológico global.