GPT-5 excelle dans le benchmark de révision de code de Qodo
2025-08-08
Qodo a utilisé son benchmark PR privé, simulant les workflows de révision de code du monde réel, pour évaluer les modèles de langage de pointe, y compris GPT-5. Les résultats ont montré que GPT-5 excellait dans la compréhension des différences de code, l'identification des bogues et la suggestion d'améliorations. Sa variante « minimale » a équilibré vitesse et qualité de manière impressionnante. Bien que GPT-5 ait présenté quelques faiblesses, telles que les faux positifs et l'étiquetage incohérent, ses performances globales en matière de révision de code ont été étonnantes, marquant un progrès significatif dans la révision de code assistée par l'IA.
Développement
Révision de Code