Devstral : LLM open source surpasse GPT-4.1-mini sur le benchmark d'ingénierie logicielle

Tags populaires：

Virtualisation sécurité DNS vérification formelle analyse d'atteignabilité erreurs du compilateur conflit de macro extension web framework de développement Graphiques bitmap incohérences d'API Tous les tags

2025-05-21

Mistral AI et All Hands AI ont collaboré pour lancer Devstral, un grand modèle de langage (LLM) agentique pour les tâches d'ingénierie logicielle. Devstral excelle sur le benchmark SWE-Bench Verified, atteignant un score supérieur à 46,8 %, soit plus de 6 % de mieux que les modèles open source précédents et surpassant même GPT-4.1-mini. Il gère les problèmes complexes d'ingénierie logicielle, tels que la compréhension des relations contextuelles au sein de grandes bases de code et l'identification de bugs subtils. Devstral est léger, fonctionnant sur une seule RTX 4090 ou un Mac avec 32 Go de RAM, et prend en charge le déploiement local, l'utilisation en entreprise et l'intégration Copilot. Le modèle est open source et disponible via une API et diverses options de téléchargement.

Développement