オープンソースAIエージェントRefact.ai、SWE-bench Verifiedで驚異の69.8%を達成

2025-05-22
オープンソースAIエージェントRefact.ai、SWE-bench Verifiedで驚異の69.8%を達成

Refact.aiは、主要なオープンソースAIプログラミングエージェントであり、SWE-bench Verifiedベンチマークで69.8%という素晴らしいスコアを達成し、500件の現実世界のGitHubの問題のうち349件を自律的に解決しました。この成功は、堅牢なアーキテクチャによるものです。中核となるClaude-3.7モデル、デバッグとコード修正のためのdebug_script()サブエージェント、最適化された問題解決のためのstrategic_planning()ツールです。Refact.aiのパイプライン全体はオープンソースであり、現実世界のアプリケーションでは開発者の生産性の大幅な向上を実証しています。

AI