TinyZero: إطلاق العنان لقدرات الاستدلال في نماذج اللغات الكبيرة بتكلفة منخفضة
2025-01-25
يُظهر مشروع TinyZero كيفية تزويد نماذج اللغات الكبيرة (LLMs) بقدرات التحقق الذاتي والبحث بتكلفة منخفضة، باستخدام تقنية التعلم المعزز. تم بناء المشروع على veRL، ويجري تجارب باستخدام سلسلة نماذج Qwen2.5، ويوفر تعليمات مفصلة حول التثبيت وإعداد البيانات والتدريب. حتى النماذج الأصغر حجمًا يمكنها تحقيق استنتاجات متطورة. يُبرز المشروع جدوى تعزيز LLMs من خلال تقنية التعلم المعزز، مما يوفر نهجًا جديدًا لبحث الذكاء الاصطناعي ذي الكفاءة من حيث التكلفة.
الذكاء الاصطناعي
ذكاء اصطناعي منخفض التكلفة