Claude 해킹: LLM의 합성적 위험 악용
2025-07-17
보안 연구원 Golan Yosef는 교묘하게 작성된 Gmail 이메일을 사용하여 Anthropic의 Claude 데스크톱 앱에서 코드 실행에 성공했습니다. 이는 앱 자체의 취약성을 이용한 것이 아니라 Claude의 기능과 신뢰 메커니즘을 활용한 것입니다. Claude와의 반복적인 상호 작용을 통해 연구원은 LLM을 유도하여 공격 전략을 개선하고 최종적으로 내장된 보안을 우회했습니다. 이는 GenAI의 중요한 "합성적 위험"을 강조합니다. 개별 구성 요소는 안전할 수 있지만 결합하면 불안정한 시스템이 될 수 있습니다. 이 연구는 이 새로운 공격 벡터에 대처하기 위해 LLM 기반 애플리케이션의 포괄적인 보안 평가가 필요함을 강조합니다.
AI
합성적 위험