Qodo Command alcança impressionantes 71,2% no SWE-bench Verified

2025-08-12
Qodo Command alcança impressionantes 71,2% no SWE-bench Verified

O Qodo Command, um agente de codificação de IA de linha de comando, alcançou uma impressionante pontuação de 71,2% no benchmark SWE-bench Verified, um teste líder para avaliar agentes de IA em tarefas de engenharia de software do mundo real. Essa pontuação foi alcançada usando a versão de produção do Qodo Command sem ajustes específicos para o benchmark. Seu sucesso decorre de recursos como resumo de contexto, planejamento de execução, mecanismos de repetição e fallback e a estrutura LangGraph. Projetado para suportar vários LLMs, o Qodo Command atualmente se associa ao Claude 4 da Anthropic para criar agentes de codificação adaptáveis e orientados para a aprendizagem.

Leia mais
Desenvolvimento

GPT-5 se destaca no benchmark de revisão de código da Qodo

2025-08-08
GPT-5 se destaca no benchmark de revisão de código da Qodo

A Qodo utilizou seu benchmark PR privado, simulando fluxos de trabalho de revisão de código do mundo real, para avaliar modelos de linguagem de ponta, incluindo o GPT-5. Os resultados mostraram que o GPT-5 se destacou na compreensão de diffs de código, na identificação de bugs e na sugestão de melhorias. Sua variante 'mínima' equilibrou velocidade e qualidade de forma impressionante. Embora o GPT-5 tenha apresentado algumas fraquezas, como falsos positivos e rotulagem inconsistente, seu desempenho geral na revisão de código foi impressionante, marcando um progresso significativo na revisão de código assistida por IA.

Leia mais
Desenvolvimento

Qodo Gen CLI: Automatize seu SDLC com agentes de IA

2025-06-25
Qodo Gen CLI: Automatize seu SDLC com agentes de IA

O Qodo Gen CLI é uma poderosa interface de linha de comando para construir, gerenciar e executar agentes de IA. Os desenvolvedores podem criar agentes personalizados para automatizar fluxos de trabalho em todo o ciclo de vida de desenvolvimento de software (SDLC), integrando recursos de IA em qualquer IDE. Com suporte para LLMs líderes e opções de implantação flexíveis, o Qodo Gen CLI oferece interfaces baseadas em terminal e navegador. Automatize tarefas como revisão de código, geração de documentação e cobertura de testes, aumentando a eficiência e permitindo que os desenvolvedores se concentrem na construção de recursos.

Leia mais
Desenvolvimento automação do SDLC

Geração de código de IA: precisão e confiança são essenciais

2025-06-12
Geração de código de IA: precisão e confiança são essenciais

Apenas 3,8% dos desenvolvedores relatam ter experimentado baixa alucinação e alta confiança no envio de código gerado por IA. Essas são as equipes que realmente se beneficiam da IA na produção. Eles confiam nas sugestões, enviam mais rápido e fecham o ciclo com feedback de alta qualidade. Entre esse grupo de baixa alucinação, aqueles que também se sentem confiantes (17%) relatam: 1,3 vezes maior probabilidade de ver ganhos na qualidade do código (44% vs. 35%); 2,5 vezes mais confiança no envio de código de IA (24% vs. 9%). Este é o grupo que consideramos o “ponto ideal” — e, dentro dele, mais da metade (53%) relata melhorias claras na qualidade do código. Isso sugere uma forte ligação entre precisão, qualidade e confiança. Quando os desenvolvedores veem menos erros e saída de maior qualidade, eles têm muito mais probabilidade de confiar na IA e usá-la na produção. Também vemos que baixas alucinações tornam os desenvolvedores 1,3 vezes mais propensos a dizer que a IA melhorou a qualidade do código (44% vs. 35% no geral). Ainda assim, a maioria dos desenvolvedores — mesmo aqueles com saída precisa — permanece hesitante. É aí que os controles de qualidade automatizados podem preencher a lacuna.

Leia mais
Desenvolvimento confiança do desenvolvedor

Depurando erros de lógica Java com testes unitários

2025-05-07
Depurando erros de lógica Java com testes unitários

Erros de lógica no desenvolvimento Java são notoriamente difíceis de depurar usando métodos tradicionais. Este artigo apresenta uma abordagem de depuração direcionada por testes, utilizando testes unitários para descobrir e identificar erros de lógica. Ele detalha várias técnicas de teste, incluindo testes de hipótese, testes de progressão de estado e testes de regressão, e explica como alavancar os resultados dos testes para entender o comportamento do código e, finalmente, melhorar a lógica. O artigo também menciona ferramentas de teste unitário assistidas por IA que podem ajudar os desenvolvedores a descobrir com mais eficácia potenciais vulnerabilidades lógicas.

Leia mais
Desenvolvimento Erros de Lógica

LangGraph: Construindo um Assistente de Codificação de IA Flexível e com Boas Práticas

2025-03-24
LangGraph: Construindo um Assistente de Codificação de IA Flexível e com Boas Práticas

A Qodo construiu um assistente de codificação de IA usando o framework LangGraph, equilibrando flexibilidade com a adesão às melhores práticas de codificação. Inicialmente, eles usaram fluxos predefinidos para tarefas de codificação, mas com o advento de LLMs mais poderosos como o Claude Sonnet 3.5, eles mudaram para a abordagem baseada em grafos do LangGraph. O LangGraph permite a construção de agentes que variam de totalmente abertos a fluxos determinísticos totalmente estruturados, permitindo que a Qodo ajuste a estrutura de seus fluxos com base nas capacidades do LLM. A API limpa do framework, os componentes reutilizáveis e a administração de estado integrada simplificaram o desenvolvimento e suportam persistência, checkpoints e pontos de ramificação. Embora a documentação e os testes apresentem alguns desafios, o LangGraph forneceu uma base sólida para a Qodo construir um assistente de codificação de IA robusto.

Leia mais
Desenvolvimento

Qodo Gen 1.0: Codificação com IA Agencial usando LangGraph e MCP

2025-03-18
Qodo Gen 1.0: Codificação com IA Agencial usando LangGraph e MCP

O Qodo Gen 1.0 apresenta fluxos agenciais em seu plugin de IDE de codificação e teste de IA, permitindo que a IA decida dinamicamente como navegar por tarefas complexas de codificação. Isso foi alcançado reestruturando a infraestrutura usando LangGraph para fluxos de trabalho estruturados e o Protocolo de Contexto do Modelo (MCP) da Anthropic para integração de ferramentas externas padronizada. A arquitetura suporta comunicação assíncrona, recuperação de contexto sob demanda e tratamento aprimorado de erros e confiabilidade, permitindo que a IA opere de forma autônoma, recupere dados em tempo real e adapte estratégias com base nos resultados da execução da ferramenta. O LangGraph fornece flexibilidade e controle, enquanto o MCP simplifica a integração de ferramentas externas. O resultado é uma automação mais inteligente, um sistema extensível e uma abordagem estruturada para a autonomia da IA.

Leia mais
Desenvolvimento

Qodo-Embed-1: Família de modelos de embedding de código eficientes e compactos

2025-03-03
Qodo-Embed-1: Família de modelos de embedding de código eficientes e compactos

A Qodo anunciou o Qodo-Embed-1, uma nova família de modelos de embedding de código que alcança desempenho de ponta com um tamanho significativamente menor do que os modelos existentes. O modelo de 1,5B de parâmetros obteve uma pontuação de 68,53 no benchmark CoIR, superando modelos maiores de 7B de parâmetros. Treinado usando geração de dados sintéticos para superar as limitações dos modelos existentes na recuperação precisa de trechos de código, o Qodo-Embed-1 melhora significativamente a precisão e a eficiência da recuperação de código. O modelo de 1,5B de parâmetros é de código aberto, enquanto o modelo de 7B de parâmetros está disponível comercialmente.

Leia mais

Construindo uma estrutura de avaliação robusta para sistemas RAG

2025-02-14
Construindo uma estrutura de avaliação robusta para sistemas RAG

A Qodo construiu um assistente de codificação de IA baseado em geração aumentada por recuperação (RAG) e desenvolveu uma estrutura de avaliação robusta para garantir precisão e abrangência. Os desafios incluíam verificar a correção das saídas RAG derivadas de grandes conjuntos de dados privados. A estrutura avalia os documentos recuperados finais e a saída gerada final, focando na 'correção da resposta' e na 'precisão da recuperação'. Para lidar com os desafios das saídas de linguagem natural, eles empregaram uma abordagem 'LLM como juiz' e construíram um conjunto de dados de verdade fundamental com perguntas, respostas e contexto reais. Para maior eficiência, eles usaram LLMs para auxiliar na construção do conjunto de dados e usaram LLMs e RAGAS para avaliar a correção da resposta. Por fim, eles construíram seu próprio juiz LLM e o combinaram com o RAGAS para melhorar a confiabilidade, integrando-o em seu fluxo de trabalho com testes de regressão, reduzindo drasticamente o esforço para verificar o impacto das alterações de código na qualidade.

Leia mais
Desenvolvimento Avaliação de LLM

Qodo Merge 1.0: Evolução da Revisão de Código com IA

2025-02-02
Qodo Merge 1.0: Evolução da Revisão de Código com IA

O Qodo Merge 1.0, uma ferramenta de revisão de código impulsionada por IA, aborda os desafios inerentes à codificação assistida por IA após mais de um ano de desenvolvimento. A nova versão apresenta um modo de foco em problemas que prioriza problemas críticos como bugs e falhas de segurança; aprendizado dinâmico que refina sugestões com base em mudanças aceitas; integração de contexto de ticket em tempo real; e um comando `/implement` para traduzir feedback em mudanças de código acionáveis. O Qodo Merge 1.0 torna a revisão de código mais precisa, adaptável e eficiente.

Leia mais

Sugestões de código de IA eficazes: menos é mais

2025-01-29
Sugestões de código de IA eficazes: menos é mais

A Qodo (anteriormente Codium), com sua ferramenta de IA para análise e feedback automatizados de pull requests, Qodo Merge, descobriu uma lição crucial sobre o uso de LLMs para revisão de código. Inicialmente, priorizar a detecção de bugs sobre sugestões de estilo mostrou-se ineficaz; o modelo foi sobrecarregado pelas questões de estilo mais fáceis de encontrar, levando à fadiga de sugestões entre os desenvolvedores. A solução veio da simplificação da tarefa do modelo: focar apenas na busca de bugs e problemas significativos. Esse foco preciso aumentou as taxas de detecção de bugs e a relação sinal-ruído, resultando em um aumento de 50% nas taxas de aceitação de sugestões e um aumento de 11% no impacto geral. A principal conclusão: às vezes, eliminar distrações é mais eficaz do que uma priorização complexa.

Leia mais
Desenvolvimento

LLM de código aberto DeepSeek-R1 integrado ao Qodo Gen

2025-01-27
LLM de código aberto DeepSeek-R1 integrado ao Qodo Gen

A Qodo (anteriormente Codium) anunciou a integração do DeepSeek-R1, um poderoso modelo de linguagem grande de código aberto comparável ao o1 da OpenAI, em seu assistente de codificação com tecnologia de IA, o Qodo Gen. Conhecido por suas fortes capacidades de raciocínio e custo-benefício, o DeepSeek-R1 lida com desafios de codificação complexos, gerando respostas mais rapidamente e a um custo menor do que muitos modelos proprietários. O Qodo Gen suporta vários LLMs de primeira linha, oferecendo aos desenvolvedores uma experiência de codificação assistida por IA segura e confiável.

Leia mais

Depurador Python do VS Code: Além das instruções print

2025-01-10
Depurador Python do VS Code: Além das instruções print

Cansado de preencher seu código Python com instruções print? Os poderosos recursos de depuração do Visual Studio Code revolucionarão seu fluxo de trabalho. Este tutorial abrange a configuração do depurador Python do VS Code, gerenciamento de breakpoints, inspeção de variáveis e técnicas avançadas como tratamento de exceções, depuração remota e análise de desempenho. Aprenda como depurar seu código Python de forma eficiente, deixando para trás a era ineficiente das instruções print, e aumente sua eficiência de desenvolvimento.

Leia mais
Desenvolvimento depuração Python