Qodo Command、SWE-bench Verifiedで驚異の71.2%を達成

コマンドラインAIコーディングエージェントであるQodo Commandが、実世界のソフトウェアエンジニアリングタスクにおけるAIエージェントを評価する主要なベンチマークであるSWE-bench Verifiedで、驚異の71.2%というスコアを達成しました。このスコアは、ファインチューニングやベンチマーク固有の調整を行わず、Qodo Commandのプロダクションバージョンを使用して達成されました。その成功は、コンテキスト要約、実行計画、リトライとフォールバックメカニズム、そしてLangGraphフレームワークなどの機能によるものです。複数のLLMをサポートするように設計されており、Qodo Commandは現在、AnthropicのClaude 4と提携して、適応性が高く学習指向のコーディングエージェントを作成しています。
続きを読む