روبوبيانيست: إتقان العزف على البيانو باستخدام التعلم المعزز العميق
درب الباحثون أيدي روبوتات آلية الشكل على العزف على البيانو باستخدام تقنية التعلم المعزز العميق. قاموا ببناء بيئة محاكاة باستخدام محرك MuJoCo الفيزيائي، تضمنت لوحة مفاتيح رقمية مكونة من 88 مفتاحًا، ويدين روبوتيتين من نوع Shadow Dexterous Hands، كل منهما يحتوي على 24 درجة من الحرية. تم تحويل ملفات MIDI إلى مسارات ملاحظات مؤرشفة زمنيًا، لتكون بمثابة تمثيل الهدف لوكيل التعلم المعزز. للتغلب على تحدي الاستكشاف في مساحة العمل متعددة الأبعاد، تم دمج المعارف البشرية السابقة في شكل تسميات الأصابع في دالة المكافأة. وتم استخدام خوارزمية RL الخالية من النماذج المتطورة DroQ لتدريب الوكيل، مما أسفر عن عروض بيانو ناجحة في العديد من القطع، محققًا درجات F1 رائعة في مجموعة Etude-12 الفرعية. كما أن البحث ينشر معيارًا محاكاة ومجموعة بيانات للمضي قدمًا في التحكم متعدد الأبعاد.
اقرأ المزيد