微软:'Skeleton Key'攻击揭示人工智能最糟糕的一面

2024-06-29

微软披露了一种名为“Skeleton Key”的技术,该技术可以绕过AI模型的安全护栏,这些护栏原本用于防止生成式聊天机器人创建有害内容。研究人员通过简单的文本提示,成功诱导Meta、谷歌和Anthropic等公司的AI模型生成了诸如制造燃烧瓶的说明等危险信息。微软已在其Azure云平台上部署了安全工具来应对这种攻击,但更强大的对抗性攻击仍需关注。

未分类 微软Azure