Kimi k1.5 de MoonshotAI: Un avance en RL y LLMs

2025-01-21
Kimi k1.5 de MoonshotAI: Un avance en RL y LLMs

MoonshotAI ha presentado Kimi k1.5, un nuevo modelo de lenguaje grande multimodal entrenado con aprendizaje por refuerzo, logrando resultados de vanguardia en varios puntos de referencia. La clave del éxito de Kimi k1.5 es su ventana de contexto de 128k y sus métodos mejorados de optimización de políticas, lo que permite capacidades de razonamiento sólidas sin técnicas complejas como la búsqueda de árbol Monte Carlo. Supera a GPT-4o y Claude Sonnet 3.5 en pruebas como AIME, MATH-500 y Codeforces, mostrando también mejoras significativas en el razonamiento de contexto corto. Kimi k1.5 estará disponible pronto en https://kimi.ai.

IA