Devstral: 소프트웨어 엔지니어링 벤치마크에서 GPT-4.1-mini 능가하는 오픈소스 LLM

2025-05-21
Devstral: 소프트웨어 엔지니어링 벤치마크에서 GPT-4.1-mini 능가하는 오픈소스 LLM

Mistral AI와 All Hands AI가 협력하여 소프트웨어 엔지니어링 작업을 위한 에이전트형 대규모 언어 모델(LLM)인 Devstral을 출시했습니다. Devstral은 SWE-Bench Verified 벤치마크에서 뛰어난 성능을 보여주며 46.8%를 넘는 점수를 기록하여 이전의 오픈소스 모델보다 6% 이상 앞섰고, GPT-4.1-mini도 능가했습니다. 대규모 코드베이스 내의 맥락 관계 이해나 미묘한 버그 식별 등 복잡한 소프트웨어 엔지니어링 문제를 해결할 수 있습니다. Devstral은 경량으로 단일 RTX 4090 또는 32GB RAM이 장착된 Mac에서 실행되며, 로컬 배포, 엔터프라이즈 사용, Copilot 통합을 지원합니다. 이 모델은 오픈소스이며 API 및 다양한 다운로드 방식으로 제공됩니다.

개발