MoonshotAI发布Kimi k1.5:强化学习与LLM的里程碑

2025-01-21
MoonshotAI发布Kimi k1.5:强化学习与LLM的里程碑

MoonshotAI团队发布了其最新的多模态大型语言模型Kimi k1.5,该模型通过强化学习训练,在多个基准测试中取得了最先进的结果。Kimi k1.5的关键在于其128k的长上下文窗口和改进的策略优化方法,无需复杂的蒙特卡洛树搜索等技术,即可实现强大的推理能力。其在AIME、MATH-500和Codeforces等测试上的表现优于GPT-4o和Claude Sonnet 3.5,并在短上下文推理方面也取得了显著的提升。Kimi k1.5很快将在https://kimi.ai上线。

AI