s1 : Mise à l’échelle simple au moment des tests pour des performances de raisonnement solides
2025-02-03
Cet article présente s1, une méthode simple de mise à l’échelle au moment des tests qui atteint des performances de raisonnement solides, comparables à celles de o1-preview, en utilisant seulement 1 000 exemples et une contrainte budgétaire. La méthode améliore considérablement les performances des grands modèles de langage grâce à des stratégies intelligentes au moment des tests. Le code et les données sont open source pour la reproductibilité et une exploration plus approfondie.