モデル合金:AIパフォーマンス向上のための秘密兵器

2025-07-21
モデル合金:AIパフォーマンス向上のための秘密兵器

XBOWチームは、「モデル合金」という巧妙な手法を用いて、脆弱性検出エージェントのパフォーマンスを劇的に向上させました。この手法は、異なるLLM(Google GeminiやAnthropic Sonnetなど)の長所を組み合わせ、単一のチャットスレッド内でそれらを交互に使用することで、単一モデルの限界を克服します。実験の結果、この「合金」戦略は成功率を55%以上にまで向上させ、単一モデルを大幅に上回ることが示されました。この技術はサイバーセキュリティの分野に限定されず、膨大な探索空間の中で解決策を見つける必要があるあらゆるAIエージェントタスクに関連しています。

続きを読む

自律型AIペネトレーションテスターXBOWがHackerOne米国リーダーボードでトップに

2025-06-25
自律型AIペネトレーションテスターXBOWがHackerOne米国リーダーボードでトップに

バグバウンティの歴史上初めて、自律型AIペネトレーションテスターであるXBOWが、HackerOneの米国リーダーボードでトップの座を獲得しました。XBOWは最初にCTFチャレンジとオープンソースプロジェクトでベンチマークを行い、多くのゼロデイ脆弱性を発見し、報告しました。その後、HackerOneのバグバウンティプログラムに参加し、数千のターゲットに対してブラックボックステストを実施しました。Palo AltoのGlobalProtect VPNにおける未知の脆弱性を含む、約1060件の検証済みの脆弱性レポートにより、トップランクに到達しました。これは、サイバーセキュリティにおけるAIの可能性の高さを示しています。

続きを読む
テクノロジー