Sutton의 강화학습 책에서 가져온 알고리즘

2025-05-06
Sutton의 강화학습 책에서 가져온 알고리즘

이 GitHub 저장소는 Sutton의 유명한 강화학습 교재인 "Reinforcement Learning: An Introduction"의 알고리즘과 모델을 구현하는 코드를 제공합니다. 코드는 상태, 행동, 전이 함수의 정의만 필요로 하는 다양한 모델 없는 솔버를 다룹니다. 예로는 단일 상태의 무한 분산 문제와 몬테카를로 트리 탐색 미로 솔버가 있습니다. 프로덕션 환경에 최적화되어 있지는 않지만, 강화학습을 배우고 알고리즘을 처음부터 구현하는 데 귀중한 자료입니다.

개발