نحو التفكير من النوع الثاني في نماذج اللغات الكبيرة: تعلم التفكير باستخدام سلسلة الفكر الميتا
2025-01-10
يقترح الباحثون إطارًا جديدًا يسمى سلسلة الفكر الميتا (Meta-CoT) ، والذي يوسع طريقة سلسلة الفكر (CoT) التقليدية من خلال نمذجة التفكير الكامن وراء CoT معين بشكل صريح. يستخدم Meta-CoT الإشراف على العملية ، وتوليد البيانات الاصطناعية ، وخوارزميات البحث. يحدد البحث خط أنابيب للتدريب يتضمن ضبط التعليمات مع مسارات بحث خطية وتعلم التعزيز بعد التدريب. يوفر هذا العمل خارطة طريق لتمكين Meta-CoT في نماذج اللغات الكبيرة ، مما يوعد بتفكير أكثر قوة وأكثر تشابهًا مع البشر في الذكاء الاصطناعي.
الذكاء الاصطناعي
سلسلة الفكر