Kimi k1.5 de MoonshotAI : Une percée en RL et LLMs
2025-01-21
MoonshotAI a dévoilé Kimi k1.5, un nouveau modèle linguistique multimodal de grande taille entraîné par apprentissage par renforcement, obtenant des résultats de pointe sur plusieurs benchmarks. La clé du succès de Kimi k1.5 réside dans sa fenêtre de contexte de 128k et ses méthodes d'optimisation de politique améliorées, permettant des capacités de raisonnement solides sans techniques complexes comme la recherche d'arbre Monte-Carlo. Il surpasse GPT-4o et Claude Sonnet 3.5 sur des tests comme AIME, MATH-500 et Codeforces, montrant également des améliorations significatives dans le raisonnement à court contexte. Kimi k1.5 sera bientôt disponible sur https://kimi.ai.
IA