도입 2023년 현재, Open AI에서 개발한 GPT라는 거대한 언어모델의 등장으로 인해 사람들에게 인공지능이 크게 주목받고 있다. 그러나 chatGPT이전에 “인공지능”이 무엇이고 얼마나 발전했는지를 실제로 체감하게 만들었던 대표적인 사례는 바로 Google DeepMind에서 개발한 알파고(AlphaGo)일 것이다. 우리나라의 바둑 9단인 이세돌과 대국했던 알파고는 5번의 경기중에서 1번을 제외한 모든 경기에서 뛰어난 성능을 보이며 사람보다도 이제는 학습된 인공지능이 더 잘하는 작업이 생겨나고 있음을 알리게 되었다. 이런 알파고를 학습시킬 때 사용되었던 것이 바로 강화학습이다. 그중에서도 행동에 대한 가치를 평가하는 value network, 수행할 행동을 선택하는 policy network를 신경..