Suttonの書籍からの強化学習アルゴリズム

2025-05-06
Suttonの書籍からの強化学習アルゴリズム

このGitHubリポジトリは、Suttonの有名な強化学習の教科書「Reinforcement Learning: An Introduction」からのアルゴリズムとモデルを実装するコードを提供します。コードは、状態、行動、遷移関数の定義のみを必要とするさまざまなモデルフリーソルバーを網羅しています。例としては、単一状態の無限分散問題とモンテカルロ木探索迷路ソルバーがあります。本番環境向けに最適化されていませんが、強化学習を学び、アルゴリズムをゼロから実装するために貴重なリソースとなります。

開発