Devstral:オープンソースLLMがソフトウェアエンジニアリングベンチマークでGPT-4.1-miniを凌駕

2025-05-21
Devstral:オープンソースLLMがソフトウェアエンジニアリングベンチマークでGPT-4.1-miniを凌駕

Mistral AIとAll Hands AIが共同で、ソフトウェアエンジニアリングタスクのためのエージェンティックな大規模言語モデル(LLM)であるDevstralをリリースしました。DevstralはSWE-Bench Verifiedベンチマークで優れた性能を発揮し、46.8%を超えるスコアを獲得、以前のオープンソースモデルを6%以上上回り、GPT-4.1-miniをも凌駕しました。大規模なコードベースにおけるコンテキスト関係の理解や微妙なバグの特定など、複雑なソフトウェアエンジニアリング問題に対処できます。Devstralは軽量で、単体のRTX 4090または32GB RAM搭載のMacで動作し、ローカル展開、エンタープライズ利用、Copilot統合をサポートしています。このモデルはオープンソースであり、APIと様々なダウンロード方法で提供されています。

開発