일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Loss Function
- 코드업
- @Transactional
- 양방향 매핑
- OG tag
- react native
- idToken
- marksense.ai
- google 로그인
- AWS
- 졸프
- JPA
- oauth
- 순환참조
- google login
- yolo
- google cloud
- STT
- C++
- pandas
- html
- javascript
- Spring Boot
- 커스텀 데이터 학습
- 2021 제9회 문화공공데이터 활용경진대회
- skt fellowship 3기
- Expo
- YOLOv5
- matplotlib
- Spring
Archives
- Today
- Total
민팽로그
강화학습(Reinforcement Learning) 개념 본문
지도학습: 배움을 통해 학습 <-> 강화학습: 일단 부딛혀보며 경험을 통해 학습
강화학습의 기본 원리: 행동의 결과에 따라 보상과 벌을 받기를 무수히 반복하며 가장 많은 보상을 받을 수 있는 방법을 학습
- Environment(환경): 학습 환경
- action(행동): 환경의 상태
- agent(에이전트): 행위 주체
- reword(보상): 올바른 행위를 했을 때 주어지는 보상
- policy: 판단력, 판단 정책
강화학습의 목적 -> 상태에 따라 더 많은 보상을 받을 수 있는 행동을 agent가 할 수 있도록 하는 정책을 만드는 것
출처: 생활코딩
'머신러닝&딥러닝' 카테고리의 다른 글
9월 28일 언어 지능 실습 정리 (0) | 2021.09.28 |
---|---|
Recurrent Neural Network(RNN) (0) | 2021.09.28 |
활성화 함수(Activation Function) (0) | 2021.09.28 |
선형 회귀(Linear Regression) (0) | 2021.09.27 |
[용어 정리]object detection 공부하면서 모르는 용어 (0) | 2021.08.31 |
Comments