GPT-5 destaca en el benchmark de revisión de código de Qodo
2025-08-08
Qodo utilizó su benchmark PR privado, simulando flujos de trabajo de revisión de código del mundo real, para evaluar modelos de lenguaje de vanguardia, incluyendo GPT-5. Los resultados mostraron que GPT-5 sobresalió en la comprensión de diferencias de código, la identificación de errores y la sugerencia de mejoras. Su variante 'mínima' equilibró velocidad y calidad de forma impresionante. Si bien GPT-5 presentó algunas debilidades, como falsos positivos y etiquetado inconsistente, su rendimiento general en la revisión de código fue sorprendente, marcando un progreso significativo en la revisión de código asistida por IA.
Desarrollo