Kimi k1.5 da MoonshotAI: Avanço em RL e LLMs

2025-01-21
Kimi k1.5 da MoonshotAI: Avanço em RL e LLMs

A MoonshotAI revelou o Kimi k1.5, um novo modelo de linguagem grande multimodal treinado com aprendizado por reforço, alcançando resultados de última geração em vários benchmarks. A chave para o sucesso do Kimi k1.5 é sua janela de contexto de 128k e métodos aprimorados de otimização de políticas, permitindo capacidades de raciocínio robustas sem técnicas complexas como a pesquisa de árvore Monte Carlo. Ele supera o GPT-4o e o Claude Sonnet 3.5 em testes como AIME, MATH-500 e Codeforces, mostrando também melhorias significativas no raciocínio de contexto curto. O Kimi k1.5 estará disponível em breve em https://kimi.ai.

IA