MoonshotAIのKimi k1.5:強化学習とLLMの飛躍的進歩

2025-01-21
MoonshotAIのKimi k1.5:強化学習とLLMの飛躍的進歩

MoonshotAIは、強化学習によって訓練された新しいマルチモーダル大規模言語モデル、Kimi k1.5を発表しました。これは様々なベンチマークで最先端の結果を達成しています。Kimi k1.5の成功の鍵は、128kのコンテキストウィンドウと改良されたポリシー最適化手法であり、モンテカルロ木探索などの複雑な手法に頼ることなく、強力な推論能力を実現しています。AIME、MATH-500、CodeforcesなどのテストでGPT-4oやClaude Sonnet 3.5を凌駕し、短いコンテキストでの推論でも大幅な改善を示しています。Kimi k1.5はまもなくhttps://kimi.aiで利用可能になります。

AI