Webtagr - Technology News Summarizer

Popular：

Virtualization DNS security formal verification reachability analysis compiler errors macro conflict web extension development framework Bitmap Graphics API inconsistencies All Tags

s1 : Mise à l’échelle simple au moment des tests pour des performances de raisonnement solides

2025-02-03

Cet article présente s1, une méthode simple de mise à l’échelle au moment des tests qui atteint des performances de raisonnement solides, comparables à celles de o1-preview, en utilisant seulement 1 000 exemples et une contrainte budgétaire. La méthode améliore considérablement les performances des grands modèles de langage grâce à des stratégies intelligentes au moment des tests. Le code et les données sont open source pour la reproductibilité et une exploration plus approfondie.

(github.com)

IA performances de raisonnement mise à l’échelle au moment des tests