MoonshotAI's Kimi k1.5: Durchbruch bei RL und LLMs
2025-01-21
MoonshotAI hat Kimi k1.5 vorgestellt, ein neues multimodales großes Sprachmodell, das mit Reinforcement Learning trainiert wurde und auf verschiedenen Benchmarks Spitzenergebnisse erzielt. Der Schlüssel zum Erfolg von Kimi k1.5 liegt in seinem 128k-Kontextfenster und den verbesserten Methoden zur Richtlinienoptimierung, die ein robustes Schlussfolgerungsvermögen ermöglichen, ohne komplexe Techniken wie die Monte-Carlo-Baumsuche. Es übertrifft GPT-4o und Claude Sonnet 3.5 bei Tests wie AIME, MATH-500 und Codeforces und zeigt auch signifikante Verbesserungen beim Kurzkontext-Schlussfolgern. Kimi k1.5 wird bald unter https://kimi.ai verfügbar sein.
KI