RL이란?
강화학습(Reinforcement Learning)이라고 하며, 행동심리학에서 영감을 받은 기계학습의 영역이다.
강화학습은 보상심리를 기반으로 하여 결과에 다다르면 플러스 실패하면 마이너스라는 값을 주어 최종적으로 결과에 도달하는 원리이다.
예를 들면 강아지를 학습시킬 때 상을 줌으로써 강아지에게 원하는 행동을 가르칠 수 있다. 사람또한 크게 다르지 않다. 어릴 적 우리 또한 바른 행동을 했을 때 칭찬을 받고 바르지 못한 행동을 했을 때 꾸중을 받으며 배우고 성장해왔다. 이를 머신러닝에 접목한 것이 강화 학습이다.
강화학습은 크게 환경과 에이전트로 나뉘며, 에이전트는 환경에 적응하기 위해서 Action을 취하고 환경은 그에 따른 state와 reward를 제공한다. 최종적으로 목표를 달성할 시 보상을 받게 된다. 이러한 알고리즘을 접목시키면 강화학습은 대부분의 게임에서 사람을 뛰어넘을 수 있다.