الذكاء الاصطناعي يغزو بوكيمون الأحمر: انتصار وكيل صغير للتعلم المعزز
2025-03-05
نجح فريق في هزيمة لعبة بوكيمون الأحمر لعام 1996 باستخدام التعلم المعزز (RL) مع سياسة تحتوي على أقل من 10 ملايين معلمة - أكثر من 60000 مرة أصغر من DeepSeekV3. المشروع مفتوح المصدر ويستخدم أدوات هندسة عكسية بوكيمون ومحاكيات ألعاب موجودة. اختار الفريق RL لكفاءة جمع البيانات الخاصة به، مما يلغي الحاجة إلى مجموعات بيانات ضخمة مدربة مسبقًا. هذا يمثل طفرة في الذكاء الاصطناعي في قهر الألعاب المعقدة، ووضع معيارًا جديدًا للتعلم المعزز في بيئات أكثر صعوبة.
الذكاء الاصطناعي