بناء سيد ألعاب LLM مستقل باستخدام نماذج صغيرة وبيانات اصطناعية
2025-05-29
تتناول هذه المشاركة رحلة بناء سيد ألعاب LLM مستقل لألعاب تقمص الأدوار (TTRPGs). في البداية، كان الهدف هو اتباع نهج وكيل، لكن المؤلف اختار استراتيجية من الأسفل إلى الأعلى لفهم أفضل لعملية تطوير النموذج. نظرًا لموارد الحوسبة المحدودة، تم اختيار نموذج Qwen3 صغير، تم تدريبه على كتاب قواعد Shadowdark RPG الذي تم معالجته عبر OCR إلى تنسيق Markdown. تم إنشاء Shadowdark QA Bench للتقييم، مقارنةً العديد من المقاييس قبل الاستقرار على مطابقة قائمة على الكلمات المفتاحية. بعد التدريب المسبق وزيادة المعرفة (إنشاء العديد من الصياغات الجديدة لنص كتاب القواعد)، حقق النموذج دقة 60٪ في المعيار، محققًا هدف المؤلف. الخطوة التالية هي ضبط المساعد.
التطوير
بيانات اصطناعية