空格键就能攻破 Meta 的 AI 安全系统

2024-07-30

Meta 用于检测提示注入攻击的机器学习模型 Prompt-Guard-86M 本身就容易受到提示注入攻击。任何人都可以通过在字母之间添加空格并省略标点符号,就可以绕过 Prompt-Guard-86M 的安全防御机制,使其无法检测到潜在的有害内容。

未分类