テンセントのHunyuan-T1:Mamba搭載の初の超大型モデル、推論効率を再定義
2025-03-22
テンセントは、Hunyuan大規模言語モデルシリーズの最新モデルであるHunyuan-T1を発表しました。世界初の超大規模ハイブリッドTransformer-Mamba MoE大規模モデルであるTurboSをベースに構築されたHunyuan-T1は、広範な事後トレーニングを経て、推論能力が大幅に向上し、人間の好みとの整合性が向上しています。プレビュー版と比較して、Hunyuan-T1はパフォーマンスが大幅に向上し、デコード速度が2倍になっています。様々な公開ベンチマークでR1と同等またはわずかに優れた結果を達成し、内部の人間評価データセットでは、特に文化的および創造的な指示の追従、テキスト要約、エージェント機能においてR1を上回っています。このリリースは、大規模言語モデルの事後トレーニング最適化における強化学習の活用における重要な進歩を示しています。
AI