الذكاء الاصطناعي يغزو بوكيمون الأحمر: انتصار وكيل صغير للتعلم المعزز

العلامات الشائعة：

الافتراضية أمان DNS التحقق الرسمي تحليل قابلية الوصول أخطاء المترجم تضارب الماكرو امتدادات الويب إطار عمل تطوير كومودور 64 بياسيك 2.0 جميع العلامات

2025-03-05

نجح فريق في هزيمة لعبة بوكيمون الأحمر لعام 1996 باستخدام التعلم المعزز (RL) مع سياسة تحتوي على أقل من 10 ملايين معلمة - أكثر من 60000 مرة أصغر من DeepSeekV3. المشروع مفتوح المصدر ويستخدم أدوات هندسة عكسية بوكيمون ومحاكيات ألعاب موجودة. اختار الفريق RL لكفاءة جمع البيانات الخاصة به، مما يلغي الحاجة إلى مجموعات بيانات ضخمة مدربة مسبقًا. هذا يمثل طفرة في الذكاء الاصطناعي في قهر الألعاب المعقدة، ووضع معيارًا جديدًا للتعلم المعزز في بيئات أكثر صعوبة.

الذكاء الاصطناعي