La Tríada Letal: Nuevos Desafíos en la Seguridad de LLM

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

2025-08-10

Una charla sobre seguridad de IA se centró en la inyección de prompts, un nuevo ataque que explota las vulnerabilidades inherentes de los LLM construidos mediante la concatenación de cadenas. El orador acuñó el término "Tríada Letal", que describe tres condiciones de ataque: acceso del LLM a datos privados, ejecución de llamadas a herramientas y exfiltración de datos. Se discutieron numerosos ejemplos de ataques de inyección de prompts, destacando la insuficiencia de las defensas actuales y enfatizando la necesidad de restringir fundamentalmente el acceso del LLM a entradas no confiables. La presentación también abordó fallas de seguridad en el Protocolo de Contexto del Modelo (MCP), señalando que su enfoque de combinación y coincidencia transfiere irrazonablemente la responsabilidad de seguridad a los usuarios finales.