LLM 툴 포이즈닝 공격: 전체 스키마 포이즈닝 및 고급 툴 포이즈닝 공격

2025-06-08
LLM 툴 포이즈닝 공격: 전체 스키마 포이즈닝 및 고급 툴 포이즈닝 공격

Anthropic의 모델 컨텍스트 프로토콜(MCP)은 대규모 언어 모델(LLM)이 외부 툴과 상호 작용할 수 있도록 하지만, 연구원들은 새로운 공격 방식을 발견했습니다. 바로 툴 포이즈닝 공격(TPA)입니다. 이전 연구는 툴 설명 필드에 초점을 맞췄지만, 새로운 연구 결과는 공격 표면이 전체 툴 스키마로 확장됨을 보여주며, 이를 "전체 스키마 포이즈닝"(FSP)이라고 합니다. 더욱 위험한 것은 "고급 툴 포이즈닝 공격"(ATPA)으로, 이는 툴 출력을 조작하여 정적 분석을 어렵게 만듭니다. ATPA는 오해의 소지가 있는 오류 메시지나 후속 프롬프트를 생성하여 LLM을 속여 민감한 정보를 유출시킵니다. 본 논문에서는 이러한 공격을 완화하기 위해 정적 감지, 엄격한 적용, 런타임 감사 및 컨텍스트 무결성 검사를 수행할 것을 제안합니다.

AI 공격