Microsoft’s ‘AI Watchdog’ defends against new LLM jailbreak method | SC Media
2024-04-17
根据 Microsoft 的研究人员说法,现在有多达 94% 的图像被错误标记为“有害”。但博主 Sam Curry 发现了一种新的方法来欺骗 Microsoft 的 AI 模型,并生成高度有害的内容。虽然 Microsoft 迅速做出回应,发布了一个新的数据集来解决该问题,但这种“猫捉老鼠”的游戏可能会持续一段时间。
39
未分类