### 정의 단어
Policy = 에이전트가 어떤행동을 할지 정해주는것
Value function = 어디가 좋은 길인지
Model = 환경을 어떻게 표현하고 있는지
간단히
뭐할까
좋은건뭘까
어떤게임인가?
Policy 와 Value function 은 밀접도를 가지고 있다
###Markov Processes
S 스테이트
P Transition function
스테이트에서 다음 스테이트로 가는 확율
음
스텍구조 반복으로 결과 찾는 듯한 느낌임
'K-MOOC > 인공지능 기초' 카테고리의 다른 글
6주차 게임이론 (0) | 2020.04.09 |
---|---|
5주차 강화학습 (0) | 2020.04.02 |
3주차 휴리스틱 탐색 (0) | 2020.03.24 |
2주차 트리 써치 (0) | 2020.03.22 |
1주차 인공지능 소개 (0) | 2020.03.20 |