Devstral: LLM de código abierto supera a GPT-4.1-mini en el benchmark de ingeniería de software

2025-05-21
Devstral: LLM de código abierto supera a GPT-4.1-mini en el benchmark de ingeniería de software

Mistral AI y All Hands AI han colaborado para lanzar Devstral, un modelo de lenguaje grande (LLM) agente para tareas de ingeniería de software. Devstral destaca en el benchmark SWE-Bench Verified, alcanzando una puntuación superior al 46,8%, más de un 6% por encima de los modelos de código abierto anteriores e incluso superando a GPT-4.1-mini. Aborda problemas complejos de ingeniería de software, como comprender las relaciones contextuales dentro de grandes bases de código e identificar errores sutiles. Devstral es ligero, se ejecuta en una sola RTX 4090 o un Mac con 32 GB de RAM, y admite la implementación local, el uso empresarial y la integración con Copilot. El modelo es de código abierto y está disponible a través de API y varias opciones de descarga.

Desarrollo