LLMツールポイズニング攻撃:フルスキーマポイズニングと高度なツールポイズニング攻撃

2025-06-08
LLMツールポイズニング攻撃:フルスキーマポイズニングと高度なツールポイズニング攻撃

Anthropicのモデルコンテキストプロトコル(MCP)は、大規模言語モデル(LLM)が外部ツールとやり取りすることを可能にしますが、研究者らは新しい攻撃手法を発見しました:ツールポイズニング攻撃(TPA)。以前の研究はツールの説明フィールドに焦点を当てていましたが、新しい発見は、攻撃対象範囲がツールのスキーマ全体に及ぶことを明らかにし、「フルスキーマポイズニング」(FSP)と呼ばれています。さらに危険なのは、「高度なツールポイズニング攻撃」(ATPA)であり、これはツールの出力を操作して静的分析を困難にします。ATPAは、誤解を招くエラーメッセージやフォローアッププロンプトを作成することで、LLMを騙して機密情報を漏洩させます。本稿では、これらの攻撃を軽減するために、静的検出、厳格な適用、実行時監査、コンテキスト整合性チェックを行うことを提案しています。

AI 攻撃