RoboPianist:深層強化学習によるピアノ演奏習得
2025-02-27
研究者らは、深層強化学習を用いて、擬人化されたロボットハンドにピアノ演奏を学習させました。MuJoCo物理エンジンを用いて、88鍵のデジタルキーボードと2つのShadow Dexterous Hands(各24自由度)を含むシミュレーション環境を構築しました。MIDIファイルは時間的にインデックスされたノート軌道に変換され、強化学習エージェントの目標表現として機能しました。高次元行動空間における探索の課題に対処するために、フィンガリングラベルという形で人間の事前知識が報酬関数に組み込まれました。最先端のモデルフリーRLアルゴリズムであるDroQを用いてエージェントをトレーニングした結果、様々な楽曲で成功裏にピアノ演奏を行い、Etude-12サブセットで印象的なF1スコアを達成しました。本研究では、高次元制御の進歩のために、シミュレーションベンチマークとデータセットも公開します。
AI
深層強化学習