GPT-5 se destaca no benchmark de revisão de código da Qodo

2025-08-08
GPT-5 se destaca no benchmark de revisão de código da Qodo

A Qodo utilizou seu benchmark PR privado, simulando fluxos de trabalho de revisão de código do mundo real, para avaliar modelos de linguagem de ponta, incluindo o GPT-5. Os resultados mostraram que o GPT-5 se destacou na compreensão de diffs de código, na identificação de bugs e na sugestão de melhorias. Sua variante 'mínima' equilibrou velocidade e qualidade de forma impressionante. Embora o GPT-5 tenha apresentado algumas fraquezas, como falsos positivos e rotulagem inconsistente, seu desempenho geral na revisão de código foi impressionante, marcando um progresso significativo na revisão de código assistida por IA.

Desenvolvimento