Suttonの書籍からの強化学習アルゴリズム

人気のタグ：

仮想化 DNSセキュリティ形式的検証到達可能性解析 C言語コンパイラエラーマクロの衝突 Web拡張機能開発フレームワークコモドール64 すべてのタグ

Suttonの書籍からの強化学習アルゴリズム

2025-05-06

このGitHubリポジトリは、Suttonの有名な強化学習の教科書「Reinforcement Learning: An Introduction」からのアルゴリズムとモデルを実装するコードを提供します。コードは、状態、行動、遷移関数の定義のみを必要とするさまざまなモデルフリーソルバーを網羅しています。例としては、単一状態の無限分散問題とモンテカルロ木探索迷路ソルバーがあります。本番環境向けに最適化されていませんが、強化学習を学び、アルゴリズムをゼロから実装するために貴重なリソースとなります。

(github.com)

開発

WhippyTerm：組込み開発者向けのモダンターミナル

トランプ大統領、CISA予算4億9100万ドル削減案を発表、検閲との批判