خوارزميات التعلم المعزز من كتاب سوتون

2025-05-06
خوارزميات التعلم المعزز من كتاب سوتون

يحتوي مستودع جيثب هذا على كود ينفذ خوارزميات ونماذج من كتاب سوتون الشهير في التعلم المعزز، "التعلم المعزز: مقدمة". يغطي الكود العديد من الحلول بدون نموذج، والتي تتطلب فقط تعريف الحالات، والإجراءات، ودالة الانتقال. تتضمن الأمثلة مشكلة تباين لانهائي لحالة واحدة، وحل متاهة باستخدام بحث شجرة مونت كارلو. على الرغم من أنه ليس مُحسّنًا للإنتاج، إلا أنه مورد قيم لتعلم التعلم المعزز وتنفيذ الخوارزميات من الصفر.