Kimi k1.5 من MoonshotAI: إنجاز في مجال تعلم التعزيز ونماذج اللغة الكبيرة
2025-01-21
كشفت MoonshotAI النقاب عن Kimi k1.5، وهو نموذج لغوي متعدد الوسائط كبير تم تدريبه باستخدام تقنية تعلم التعزيز، وحقق نتائج متطورة في العديد من معايير الأداء. يكمن سر نجاح Kimi k1.5 في نافذة السياق التي تبلغ 128k وطرق تحسين استراتيجية التعلّم المُحسّنة، مما يسمح بقدرات استنتاجية قوية دون الحاجة إلى تقنيات معقدة مثل البحث الشجري لـ Monte Carlo. يتفوق على GPT-4o و Claude Sonnet 3.5 في اختبارات مثل AIME و MATH-500 و Codeforces، كما يُظهر تحسينات كبيرة في الاستنتاجات قصيرة السياق. سيكون Kimi k1.5 متاحًا قريبًا على https://kimi.ai.
الذكاء الاصطناعي