AnthropicのClaudeブラウザ拡張機能：AIセーフティのための制御されたテスト

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

2025-08-27

Anthropicは、AIアシスタントであるClaudeをブラウザ内で直接操作できるChrome拡張機能をテストしています。これはClaudeのユーティリティを大幅に向上させますが、特にプロンプトインジェクション攻撃などの重大なセキュリティ上の懸念も生じさせます。軽減策がない場合の攻撃成功率はレッドチームテストで23.6％でした。Anthropicは、アクセス許可制御、アクション確認、高度な分類器など、複数の安全対策を実装し、成功率を11.2％に削減しました。現在、この拡張機能は1000人のMaxプランユーザーを対象とした限定的なパイロットプログラムで、本番環境でのフィードバックを収集し、より広範なリリース前に安全性を向上させることを目的としています。