Devstral:开源LLM在软件工程基准测试中超越GPT-4.1-mini

2025-05-21
Devstral:开源LLM在软件工程基准测试中超越GPT-4.1-mini

Mistral AI和All Hands AI合作推出了Devstral,一个用于软件工程任务的自主式大型语言模型(LLM)。Devstral在SWE-Bench Verified基准测试中表现出色,得分超过46.8%,比之前的开源模型高出6%以上,甚至超过了GPT-4.1-mini。它能够处理复杂的软件工程问题,例如理解大型代码库中的上下文关系和识别细微的bug。Devstral轻量级,可在单RTX 4090或32GB RAM的Mac上运行,并支持本地部署、企业级应用和Copilot集成。该模型已开源,并提供API和多种下载方式。

开发