LLMにおけるシステム2推論に向けて:メタ思考連鎖による思考学習

2025-01-10
LLMにおけるシステム2推論に向けて:メタ思考連鎖による思考学習

研究者らは、従来の思考連鎖(CoT)を拡張し、特定のCoTに至るための基礎となる推論を明示的にモデル化する新しいフレームワーク「メタ思考連鎖(Meta-CoT)」を提案しています。Meta-CoTは、プロセス監視、合成データ生成、探索アルゴリズムを活用しています。本論文では、線形化された探索トレースと強化学習を用いた指示チューニングを取り入れたモデルの訓練パイプラインの概要を示しています。この研究は、LLMにおけるMeta-CoTを可能にするためのロードマップを提供し、AIにおけるより強力で人間らしい推論への道を切り開きます。