Devstral: LLM de código abierto supera a GPT-4.1-mini en el benchmark de ingeniería de software

Tags populares：

Virtualización seguridad DNS verificación formal análisis de alcanzabilidad errores del compilador conflicto de macro extensión web framework de desarrollo Gráficos de mapa de bits inconsistencias de API Todos los tags

Devstral: LLM de código abierto supera a GPT-4.1-mini en el benchmark de ingeniería de software

2025-05-21

Mistral AI y All Hands AI han colaborado para lanzar Devstral, un modelo de lenguaje grande (LLM) agente para tareas de ingeniería de software. Devstral destaca en el benchmark SWE-Bench Verified, alcanzando una puntuación superior al 46,8%, más de un 6% por encima de los modelos de código abierto anteriores e incluso superando a GPT-4.1-mini. Aborda problemas complejos de ingeniería de software, como comprender las relaciones contextuales dentro de grandes bases de código e identificar errores sutiles. Devstral es ligero, se ejecuta en una sola RTX 4090 o un Mac con 32 GB de RAM, y admite la implementación local, el uso empresarial y la integración con Copilot. El modelo es de código abierto y está disponible a través de API y varias opciones de descarga.

(mistral.ai)

Desarrollo

El láser ZEUS: El láser más potente de EE. UU. alcanza los 2 petawatts

Edición de texto colaborativa sin CRDT ni OT