머신러닝&딥러닝
강화학습(Reinforcement Learning) 개념
민팽
2021. 8. 24. 16:18
지도학습: 배움을 통해 학습 <-> 강화학습: 일단 부딛혀보며 경험을 통해 학습
강화학습의 기본 원리: 행동의 결과에 따라 보상과 벌을 받기를 무수히 반복하며 가장 많은 보상을 받을 수 있는 방법을 학습
- Environment(환경): 학습 환경
- action(행동): 환경의 상태
- agent(에이전트): 행위 주체
- reword(보상): 올바른 행위를 했을 때 주어지는 보상
- policy: 판단력, 판단 정책
강화학습의 목적 -> 상태에 따라 더 많은 보상을 받을 수 있는 행동을 agent가 할 수 있도록 하는 정책을 만드는 것
출처: 생활코딩