Gemini 2.5 Pro: O novo rei da geração de código?

2025-03-31
Gemini 2.5 Pro: O novo rei da geração de código?

O Gemini 2.5 Pro do Google, lançado em 26 de março, afirma ser o melhor em codificação, raciocínio e tudo mais. Este artigo se concentra em uma comparação direta com o Claude 3.7 Sonnet, outro modelo de codificação de ponta. Por meio de quatro desafios de codificação, o Gemini 2.5 Pro demonstrou vantagens significativas em precisão e eficiência, especialmente com sua janela de contexto de um milhão de tokens permitindo o manuseio de tarefas complexas. Embora o Claude 3.7 Sonnet tenha apresentado um bom desempenho, ele ficou pálido em comparação direta. O acesso gratuito do Gemini 2.5 Pro aumenta ainda mais seu apelo.

Leia mais
IA

Deepseek v3: Modelo LLM de código aberto com 607B de parâmetros supera GPT-4 a uma fração do custo?

2025-01-02
Deepseek v3: Modelo LLM de código aberto com 607B de parâmetros supera GPT-4 a uma fração do custo?

A Deepseek revelou seu modelo principal, o v3, um modelo Mixture-of-Experts com 607 bilhões de parâmetros e 37 bilhões de parâmetros ativos. Os testes mostraram que ele é competitivo e, em alguns casos, supera o GPT-4o da OpenAI e o Claude 3.5 Sonnet, tornando-se o melhor modelo de código aberto atual, superando o Llama 3.1 403b, Qwen e Mistral. Surpreendentemente, o Deepseek v3 atingiu esse desempenho por apenas cerca de US$ 6 milhões, utilizando engenharia inovadora: arquitetura MoE, treinamento de precisão mista FP8 e uma estrutura HAI-LLM personalizada. Ele se destaca em raciocínio e matemática, superando até mesmo o GPT-4 e o Claude 3.5 Sonnet, embora seja ligeiramente inferior em escrita e codificação. Sua excepcional relação custo-benefício o torna uma opção atraente para desenvolvedores que constroem aplicativos de IA voltados para o cliente.

Leia mais