DeepSeek : Le géant silencieux qui mène la course à l'IA en Chine
DeepSeek, une start-up chinoise d'IA discrète, est devenue une force majeure, son modèle R1 surpassant celui d'OpenAI sur plusieurs benchmarks de raisonnement. Entièrement financée par le fonds spéculatif quantitatif High-Flyer, DeepSeek privilégie la technologie fondamentale aux applications commerciales, s'engageant à rendre ses modèles open source et déclenchant une guerre des prix en Chine avec ses API abordables. Ceci est alimenté par l'accès aux vastes ressources informatiques de High-Flyer. L'objectif ambitieux de DeepSeek est d'atteindre l'Intelligence Artificielle Générale (AGI), en se concentrant sur des innovations architecturales et algorithmiques révolutionnaires comme l'attention latente multi-têtes (MLA) et le mélange d'experts sparse (DeepSeekMoE), réduisant considérablement les coûts d'inférence. Son succès provient d'une innovation globale dans l'architecture des modèles et d'une utilisation efficace des talents nationaux, contrastant fortement avec de nombreuses entreprises chinoises axées sur la commercialisation et la réplication. Le fondateur Liang Wenfeng, un idéaliste technologique, privilégie les principes aux profits, en stimulant l'innovation originale et en visant à positionner la Chine comme un contributeur significatif au progrès technologique mondial.