MiMo-7B：70億パラメータの推論能力に特化したLLM、320億パラメータモデルを凌駕

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

MiMo-7B：70億パラメータの推論能力に特化したLLM、320億パラメータモデルを凌駕

2025-04-30

Xiaomiは、推論能力に特化した70億パラメータの巨大言語モデルMiMo-7Bを発表しました。最適化された事前学習データと戦略、そして革新的な強化学習トレーニング手法により、MiMo-7Bは数学とコードの推論タスクにおいて優れた性能を示し、320億パラメータのモデルをも凌駕しています。このオープンソースモデルには、ベースモデル、SFTモデル、強化学習でトレーニングされたモデルなどの複数のチェックポイントが含まれており、強力な推論能力を持つLLMの開発に貴重なリソースを提供します。

(github.com)

自然保護区管理の科学：保全とアクセスとのバランス

ファイヤーフライ・エアロスペースのアルファロケットミッション失敗