LLMチェーン呼び出しを超えて:効率的なLLMのための微分可能なルーティング

2025-07-06
LLMチェーン呼び出しを超えて:効率的なLLMのための微分可能なルーティング

最新のLLM(大規模言語モデル)エージェントアーキテクチャは、LLM呼び出しの連鎖に大きく依存しており、コスト、レイテンシ、スケーラビリティの悪化につながっています。本稿では、LLMに依存するのではなく、ツールの選択を学習可能な関数としてモデル化する微分可能なルーターを紹介します。このアプローチは、強化学習または教師あり微調整を通じてデータからツールの選択を学習し、LLMの外で動作します。外部API呼び出しを回避し、決定性と合成可能性を向上させ、コストを削減します。実験により、この方法がコストを大幅に削減し、パフォーマンスを向上させ、モデルの動作を明確にすることが示され、プロンプトチェーンではなくプログラムのようなLLMシステムへの一歩を記しています。

続きを読む