강화학습 개척자, 튜링상 수상

2025-03-05
강화학습 개척자, 튜링상 수상

앤드류 바토와 리처드 서튼은 강화학습 분야에 대한 획기적인 공헌으로 2024년 ACM A.M. 튜링상을 수상했습니다. 1980년대부터 시작된 그들의 연구는 지능형 시스템 구축에 있어 중요한 접근 방식의 개념적, 알고리즘적 기반을 마련했습니다. 심리학과 신경과학에서 영감을 얻은 강화학습은 보상 신호를 사용하여 에이전트를 최적의 행동으로 유도합니다. 바토와 서튼은 시간차 학습과 정책 경사 방법 등 주요 알고리즘을 개발했으며, 그들의 교과서인 『강화학습 입문』은 표준 참고 자료가 되었습니다. 강화학습과 심층 학습의 결합은 AlphaGo와 ChatGPT 모델 개선과 같은 획기적인 발전을 가져왔습니다. 그들의 연구는 AI 분야를 계속해서 형성하고 있습니다.