Devstral : LLM open source surpasse GPT-4.1-mini sur le benchmark d'ingénierie logicielle
Mistral AI et All Hands AI ont collaboré pour lancer Devstral, un grand modèle de langage (LLM) agentique pour les tâches d'ingénierie logicielle. Devstral excelle sur le benchmark SWE-Bench Verified, atteignant un score supérieur à 46,8 %, soit plus de 6 % de mieux que les modèles open source précédents et surpassant même GPT-4.1-mini. Il gère les problèmes complexes d'ingénierie logicielle, tels que la compréhension des relations contextuelles au sein de grandes bases de code et l'identification de bugs subtils. Devstral est léger, fonctionnant sur une seule RTX 4090 ou un Mac avec 32 Go de RAM, et prend en charge le déploiement local, l'utilisation en entreprise et l'intégration Copilot. Le modèle est open source et disponible via une API et diverses options de téléchargement.