Devstral: LLM de código aberto supera GPT-4.1-mini em benchmark de engenharia de software

Tags populares：

Virtualização segurança DNS verificação formal análise de alcance IA erros do compilador conflito de macro extensão web framework de desenvolvimento Gráficos de Bitmap Todos os tags

Devstral: LLM de código aberto supera GPT-4.1-mini em benchmark de engenharia de software

2025-05-21

Mistral AI e All Hands AI colaboraram para lançar o Devstral, um modelo de linguagem grande (LLM) agente para tarefas de engenharia de software. O Devstral se destaca no benchmark SWE-Bench Verified, alcançando uma pontuação superior a 46,8%, mais de 6% acima dos modelos open-source anteriores e até superando o GPT-4.1-mini. Ele aborda problemas complexos de engenharia de software, como entender relacionamentos contextuais em grandes bases de código e identificar bugs sutis. O Devstral é leve, rodando em uma única RTX 4090 ou um Mac com 32 GB de RAM, e suporta implantação local, uso empresarial e integração com Copilot. O modelo é de código aberto e está disponível via API e várias opções de download.

(mistral.ai)

Desenvolvimento

Laser ZEUS: O laser mais poderoso dos EUA chega a 2 petawatts

Edição de Texto Colaborativa Sem CRDTs ou OT