### 정의 단어

Policy = 에이전트가 어떤행동을 할지 정해주는것

Value function = 어디가 좋은 길인지

Model = 환경을 어떻게 표현하고 있는지   

 

간단히   

뭐할까

좋은건뭘까

어떤게임인가?

 

 

Policy 와 Value function 은 밀접도를 가지고 있다

 

###Markov Processes

S 스테이트

P Transition function

 

스테이트에서 다음 스테이트로 가는 확율 

스텍구조 반복으로 결과 찾는 듯한 느낌임

'K-MOOC > 인공지능 기초' 카테고리의 다른 글

6주차 게임이론  (0) 2020.04.09
5주차 강화학습  (0) 2020.04.02
3주차 휴리스틱 탐색  (0) 2020.03.24
2주차 트리 써치  (0) 2020.03.22
1주차 인공지능 소개  (0) 2020.03.20
블로그 이미지

Or71nH

,