دليل مبسط لعمليات أخذ العينات في نماذج اللغات الكبيرة الحديثة

2025-05-04
دليل مبسط لعمليات أخذ العينات في نماذج اللغات الكبيرة الحديثة

تقدم هذه المقالة التقنية دليلاً شاملاً لأساليب أخذ العينات المستخدمة في توليد النصوص بواسطة نماذج اللغات الكبيرة (LLM). تبدأ المقالة بشرح سبب استخدام نماذج LLM لترقيم الكلمات الفرعية بدلاً من الكلمات أو الحروف، ثم تتعمق في العديد من خوارزميات أخذ العينات، بما في ذلك أخذ العينات حسب درجة الحرارة، وطرق الجزاء (الجزاء حسب الظهور، والجزاء حسب التردد، والجزاء حسب التكرار، وDRY)، وTop-K، وTop-P، وMin-P، وTop-A، وXTC، وTop-N-Sigma، وأخذ العينات الخالية من الذيل، وقطع إيتا، وقطع إبسيلون، وأخذ العينات النموذجية محلياً، وأخذ العينات التربيعية، وميروستات. يتم شرح كل خوارزمية باستخدام رمز زائف ورسم توضيحي. وأخيراً، تناقش المقالة ترتيب أساليب أخذ العينات وتفاعلاتها، مع تسليط الضوء على الأثر الكبير لاختلاف الترتيب على الناتج النهائي.

اقرأ المزيد