Devstral: LLM de código aberto supera GPT-4.1-mini em benchmark de engenharia de software

2025-05-21
Devstral: LLM de código aberto supera GPT-4.1-mini em benchmark de engenharia de software

Mistral AI e All Hands AI colaboraram para lançar o Devstral, um modelo de linguagem grande (LLM) agente para tarefas de engenharia de software. O Devstral se destaca no benchmark SWE-Bench Verified, alcançando uma pontuação superior a 46,8%, mais de 6% acima dos modelos open-source anteriores e até superando o GPT-4.1-mini. Ele aborda problemas complexos de engenharia de software, como entender relacionamentos contextuais em grandes bases de código e identificar bugs sutis. O Devstral é leve, rodando em uma única RTX 4090 ou um Mac com 32 GB de RAM, e suporta implantação local, uso empresarial e integração com Copilot. O modelo é de código aberto e está disponível via API e várias opções de download.

Desenvolvimento