MiMo-7B:70億パラメータの推論能力に特化したLLM、320億パラメータモデルを凌駕
2025-04-30
Xiaomiは、推論能力に特化した70億パラメータの巨大言語モデルMiMo-7Bを発表しました。最適化された事前学習データと戦略、そして革新的な強化学習トレーニング手法により、MiMo-7Bは数学とコードの推論タスクにおいて優れた性能を示し、320億パラメータのモデルをも凌駕しています。このオープンソースモデルには、ベースモデル、SFTモデル、強化学習でトレーニングされたモデルなどの複数のチェックポイントが含まれており、強力な推論能力を持つLLMの開発に貴重なリソースを提供します。
AI