Des chercheurs de Berkeley répliquent la technologie centrale de DeepSeek R1 pour seulement 30 $
2025-01-28
Une équipe d'IA de Berkeley a répliqué la technologie centrale de DeepSeek R1-Zero pour moins de 30 $, démontrant un raisonnement sophistiqué dans un petit modèle linguistique (1,5 milliard de paramètres). En utilisant le jeu de compte à rebours comme référence, ils ont montré que même des modèles modestes peuvent développer des stratégies complexes de résolution de problèmes grâce à l'apprentissage par renforcement, atteignant des performances comparables à celles de systèmes plus grands. Cette percée démocratise la recherche en IA, prouvant que des avancées significatives ne nécessitent pas de ressources massives.