GPT-5 destaca en el benchmark de revisión de código de Qodo

2025-08-08
GPT-5 destaca en el benchmark de revisión de código de Qodo

Qodo utilizó su benchmark PR privado, simulando flujos de trabajo de revisión de código del mundo real, para evaluar modelos de lenguaje de vanguardia, incluyendo GPT-5. Los resultados mostraron que GPT-5 sobresalió en la comprensión de diferencias de código, la identificación de errores y la sugerencia de mejoras. Su variante 'mínima' equilibró velocidad y calidad de forma impresionante. Si bien GPT-5 presentó algunas debilidades, como falsos positivos y etiquetado inconsistente, su rendimiento general en la revisión de código fue sorprendente, marcando un progreso significativo en la revisión de código asistida por IA.

Desarrollo