AnthropicのClaudeブラウザ拡張機能:AIセーフティのための制御されたテスト
2025-08-27
Anthropicは、AIアシスタントであるClaudeをブラウザ内で直接操作できるChrome拡張機能をテストしています。これはClaudeのユーティリティを大幅に向上させますが、特にプロンプトインジェクション攻撃などの重大なセキュリティ上の懸念も生じさせます。軽減策がない場合の攻撃成功率はレッドチームテストで23.6%でした。Anthropicは、アクセス許可制御、アクション確認、高度な分類器など、複数の安全対策を実装し、成功率を11.2%に削減しました。現在、この拡張機能は1000人のMaxプランユーザーを対象とした限定的なパイロットプログラムで、本番環境でのフィードバックを収集し、より広範なリリース前に安全性を向上させることを目的としています。
AI