Hackeando a Claude: Explotación de riesgos composicionales en LLM

2025-07-17
Hackeando a Claude: Explotación de riesgos composicionales en LLM

El investigador de seguridad Golan Yosef logró ejecutar código en la aplicación de escritorio Claude de Anthropic utilizando un correo electrónico de Gmail diseñado, no explotando vulnerabilidades en la propia aplicación, sino aprovechando las capacidades y los mecanismos de confianza de Claude. A través de un proceso iterativo que involucró a Claude, el investigador guio al LLM para refinar su estrategia de ataque, finalmente eludiendo su seguridad integrada. Esto destaca el riesgo composicional crítico en GenAI, donde componentes individuales seguros pueden crear sistemas inseguros cuando se combinan. La investigación subraya la necesidad de evaluaciones de seguridad exhaustivas de las aplicaciones basadas en LLM para abordar este nuevo vector de ataque.

Leer más