جائزة تورينج تُكرم روّاد التعلم المعزز

2025-03-05
جائزة تورينج تُكرم روّاد التعلم المعزز

حصل أندرو بارو وريتشارد ساتون على جائزة إيه سي إم إيه إم تورينج لعام 2024 لمساهماتهما الأساسية في مجال التعلم المعزز. وقد وضع بحثهما، الذي بدأ في الثمانينيات، الأساس المفاهيمي والخوارزمي لهذا النهج البالغ الأهمية في بناء الأنظمة الذكية. يستخدم التعلم المعزز، المستوحى من علم النفس وعلم الأعصاب، إشارات المكافآت لتوجيه الوكلاء نحو سلوك مثالي. وقد طور بارو وساتون خوارزميات رئيسية، مثل تعلم الفرق الزمني وأساليب تدرج السياسات، وأصبح كتابهما المدرسي "التعلم المعزز: مقدمة" مرجعًا قياسيًا. وقد أدى الجمع بين التعلم المعزز والتعلم العميق إلى إنجازات مثل ألفاجو وتحسينات في نماذج مثل ChatGPT. ويستمر عملهما في تشكيل مجال الذكاء الاصطناعي.

اقرأ المزيد
الذكاء الاصطناعي جائزة تورينج