s1：シンプルなテスト時スケーリングによる強力な推論性能

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

s1：シンプルなテスト時スケーリングによる強力な推論性能

2025-02-03

この論文では、s1というシンプルなテスト時スケーリング手法を紹介しています。わずか1000個のサンプルと予算制約だけで、o1-previewに匹敵する強力な推論性能を実現します。この手法は、巧妙なテスト時戦略により、大規模言語モデルのパフォーマンスを大幅に向上させます。コードとデータはオープンソース化されており、再現性とさらなる調査を容易にします。

(github.com)

AI 推論性能テスト時スケーリング

痒みを掻くこと：その驚くべき科学

マスク氏の若手人材が米国政府機関に潜入？