بناء سيد ألعاب LLM مستقل باستخدام نماذج صغيرة وبيانات اصطناعية

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-05-29

تتناول هذه المشاركة رحلة بناء سيد ألعاب LLM مستقل لألعاب تقمص الأدوار (TTRPGs). في البداية، كان الهدف هو اتباع نهج وكيل، لكن المؤلف اختار استراتيجية من الأسفل إلى الأعلى لفهم أفضل لعملية تطوير النموذج. نظرًا لموارد الحوسبة المحدودة، تم اختيار نموذج Qwen3 صغير، تم تدريبه على كتاب قواعد Shadowdark RPG الذي تم معالجته عبر OCR إلى تنسيق Markdown. تم إنشاء Shadowdark QA Bench للتقييم، مقارنةً العديد من المقاييس قبل الاستقرار على مطابقة قائمة على الكلمات المفتاحية. بعد التدريب المسبق وزيادة المعرفة (إنشاء العديد من الصياغات الجديدة لنص كتاب القواعد)، حقق النموذج دقة 60٪ في المعيار، محققًا هدف المؤلف. الخطوة التالية هي ضبط المساعد.