강화학습 (Reinforcement Learning)

Deep Learning

강화학습 (Reinforcement Learning)

robin0309 2022. 5. 13. 00:44

강화학습이란

-> 어떤 환경안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택가능한 행동들 중 보상을

최대화하는 행동 혹은 행동 순서를 선택하는 방법

supervised learning

-> 답을 알려주고 모델 학습을 시키고 이후에 인퍼런스를 하는구조

unsupervised learning

-> 라벨이 없지만 데이터의 특징을 스스로 분석을해서 군집을 나누는 구조

Reinforement learning

-> 데이터들은 이미 확보가 되어있고 그것을 분석하는 과정으로

지속적으로 변하는 환경에대해 옳은 결정이면 + 옳지않으면 - 와 같은 reward 시스템

즉 어떠한 action에 대해 Rule을 스스로 만들어 가는 과정이라고 생각하면 됨

강화학습의 예시

-> 쥐가 지렛대를 통해 먹이를 먹는 과정으로 함수를 학습하는 과정을 설명

강화학습의 수식

RL Components

RL 종류

- 게임 캐릭터를 강화학습으로 학습시키면 -> 게임을 잘하는 캐릭터를 만들 수 있음

-> open AI에서 공개한 모델로 큐브를 만지다가 결국 try and error 를 거쳐 제대로된 모양을 찾는 것

저작자표시 비영리 변경금지 (새창열림)

'Deep Learning' 카테고리의 다른 글

Dynamic programming (0)	2022.05.15
Markov Reward Process (0)	2022.05.15
Word2VeC (Cbow , Skip-gram) (0)	2021.04.14
BERT의 학습 원리 및 transferlearning (0)	2021.04.14
keras - Image generator (0)	2020.11.27

현재글강화학습 (Reinforcement Learning)

Data Science 관련 지식들에 대해 정리하는 공간입니다.

LEVEL2, 시계열, Word2Vec, 딥러닝, matrix factorization, pytorch, Classification, 프로그래머스, ARIMA, deeplearning, 강화학습, deepfm, feature importance, 알고리즘, LEVEL 1, Kaggle, 추천시스템, LEVEL1, 앙상블, Keras,

일	월	화	수	목	금	토
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

AI/ML 기술 블로그