민팽로그

강화학습(Reinforcement Learning) 개념 본문

머신러닝&딥러닝

강화학습(Reinforcement Learning) 개념

민팽 2021. 8. 24. 16:18

지도학습: 배움을 통해 학습 <-> 강화학습: 일단 부딛혀보며 경험을 통해 학습

 

강화학습의 기본 원리: 행동의 결과에 따라 보상과 벌을 받기를 무수히 반복하며 가장 많은 보상을 받을 수 있는 방법을 학습

  • Environment(환경): 학습 환경
  • action(행동): 환경의 상태
  • agent(에이전트): 행위 주체
  • reword(보상): 올바른 행위를 했을 때 주어지는 보상
  • policy: 판단력, 판단 정책

강화학습의 목적 -> 상태에 따라 더 많은 보상을 받을 수 있는 행동을 agent가 할 수 있도록 하는 정책을 만드는 것

 

 

출처: 생활코딩

https://youtu.be/BPCAP7DHLYw

 

Comments