K-AI #OpenAI OpenAI란? OpenAI란 비영리 인공지능 연구회사이다. 돈에 목적을 두지 않고 인류에 도움이 되고자 하는 오픈소스의 성격을 가지고 있다. 강화학습 알고리즘 개발도구이며 Python으로 구성되어있다. 여러 인공지능 라이브러리와도 연동이 된다. Frozen Lake World START LOAD LOAD LOAD HOLE LOAD LOAD LOAD END 위와 같은 길을 찾는다고 할 때, HOLE에 접근하지 않고 END를 찾아가는 방법을 찾는것은 우리에겐 너무나도 쉽다. 그러나 인공지능에게는 이것이 너무나도 어렵다. 이유가 무엇일까? 위의 문제가 쉬웠다면 아래를 보자 START 사실 이 문제의 답은 위와 같다. 그러나 아까와 같은 방법으로 쉽게 END까지 갈 수 있을까?그렇지 않다. 우리는 HOLE의 .. 카테고리 없음 7년 전
K-AI #RL이란? RL이란? 강화학습(Reinforcement Learning)이라고 하며, 행동심리학에서 영감을 받은 기계학습의 영역이다.강화학습은 보상심리를 기반으로 하여 결과에 다다르면 플러스 실패하면 마이너스라는 값을 주어 최종적으로 결과에 도달하는 원리이다. 예를 들면 강아지를 학습시킬 때 상을 줌으로써 강아지에게 원하는 행동을 가르칠 수 있다. 사람또한 크게 다르지 않다. 어릴 적 우리 또한 바른 행동을 했을 때 칭찬을 받고 바르지 못한 행동을 했을 때 꾸중을 받으며 배우고 성장해왔다. 이를 머신러닝에 접목한 것이 강화 학습이다. 강화학습은 크게 환경과 에이전트로 나뉘며, 에이전트는 환경에 적응하기 위해서 Action을 취하고 환경은 그에 따른 state와 reward를 제공한다. 최종적으로 목표를 달성할 시 .. 카테고리 없음 7년 전