معيار قياس الكتابة الإبداعية طويلة الشكل لأنظمة معالجة اللغات الكبيرة

2025-04-10

يقيس هذا المعيار قدرة نماذج اللغات الكبيرة على إنشاء سرديات طويلة. يُقيّم عملية العصف الذهني، والمراجعة، وكتابة ثمانية فصول، كل فصل بـ 1000 كلمة. تشمل المقاييس طول الفصل، والطلاقة (تجنب العبارات المفرطة الاستخدام)، والتكرار، وتدهور جودة الكتابة عبر الفصول. يتم منح درجة نهائية (من 0 إلى 100) بواسطة نموذج لغة كبير للتقييم.

اقرأ المزيد