大型语言模型工具中毒攻击:全架构中毒与高级工具中毒攻击
2025-06-08
Anthropic的模型上下文协议(MCP)允许大型语言模型(LLM)与外部工具交互,但研究人员发现了新的攻击方式:工具中毒攻击(TPA)。以往研究主要关注工具描述字段,而新的研究表明,攻击面实际上涵盖整个工具架构,即“全架构中毒”(FSP)。更危险的是“高级工具中毒攻击”(ATPA),它操纵工具输出,使静态分析难以检测。ATPA通过伪造错误消息或后续提示来诱导LLM泄露敏感信息。文章建议通过静态检测、严格执行、运行时审计和上下文完整性检查来缓解这些攻击。
阅读更多
AI