La Triade Létale : Nouveaux Défis en Matière de Sécurité des LLM
Une conférence sur la sécurité de l'IA s'est concentrée sur l'injection de prompts, une nouvelle attaque exploitant les vulnérabilités inhérentes des LLM construits par concaténation de chaînes. L'orateur a inventé le terme « Triade Létale », décrivant trois conditions d'attaque : accès du LLM à des données privées, exécution d'appels d'outils et exfiltration de données. De nombreux exemples d'attaques par injection de prompts ont été abordés, soulignant l'insuffisance des défenses actuelles et insistant sur la nécessité de restreindre fondamentalement l'accès du LLM aux entrées non fiables. La présentation a également abordé les failles de sécurité du protocole de contexte de modèle (MCP), soulignant que son approche de type « mélange et correspondance » transfère de manière déraisonnable la responsabilité de la sécurité aux utilisateurs finaux.