微软:'Skeleton Key'攻击揭示人工智能最糟糕的一面
2024-06-29
微软披露了一种名为“Skeleton Key”的技术,该技术可以绕过AI模型的安全护栏,这些护栏原本用于防止生成式聊天机器人创建有害内容。研究人员通过简单的文本提示,成功诱导Meta、谷歌和Anthropic等公司的AI模型生成了诸如制造燃烧瓶的说明等危险信息。微软已在其Azure云平台上部署了安全工具来应对这种攻击,但更强大的对抗性攻击仍需关注。
44
未分类
微软Azure