0. 강화 학습(Reinforcement Learning)

용어정리

Untitled

1) 환경(environment)

2) 에이전트(agent)

3) 상태(state)

cf) 관찰(observation): 세계에 대한 부분적인 설명

4) 행동(action)

5) 궤적(trajectory, episode)

6) 보상(reward)