Claude 3.7 Sonnet da Anthropic: Habilidades de Planejamento de IA em Exibição no Pokémon

O mais recente modelo de linguagem da Anthropic, Claude 3.7 Sonnet, demonstra capacidades de planejamento impressionantes ao jogar Pokémon. Ao contrário de modelos de IA anteriores que vagavam sem rumo ou ficavam presos em loops, o Sonnet planeja com antecedência, lembra seus objetivos e se adapta quando as estratégias iniciais falham. Embora o Sonnet ainda tenha dificuldades em cenários complexos (como ficar preso na Montanha Lua), necessitando de melhorias na compreensão de capturas de tela do jogo e na expansão da janela de contexto, isso representa um progresso significativo nas habilidades de planejamento estratégico e raciocínio de longo prazo da IA. Os pesquisadores acreditam que as demonstrações ocasionais de autoconsciência e adaptação de estratégia do Sonnet sugerem um enorme potencial para resolver problemas do mundo real.