내 꿈은 척척석사

  • 홈
  • 태그
  • 방명록

강화학습 1

[RL기초] 강화학습, 그리고 심층강화학습이란?

도입 2023년 현재, Open AI에서 개발한 GPT라는 거대한 언어모델의 등장으로 인해 사람들에게 인공지능이 크게 주목받고 있다. 그러나 chatGPT이전에 “인공지능”이 무엇이고 얼마나 발전했는지를 실제로 체감하게 만들었던 대표적인 사례는 바로 Google DeepMind에서 개발한 알파고(AlphaGo)일 것이다. 우리나라의 바둑 9단인 이세돌과 대국했던 알파고는 5번의 경기중에서 1번을 제외한 모든 경기에서 뛰어난 성능을 보이며 사람보다도 이제는 학습된 인공지능이 더 잘하는 작업이 생겨나고 있음을 알리게 되었다. 이런 알파고를 학습시킬 때 사용되었던 것이 바로 강화학습이다. 그중에서도 행동에 대한 가치를 평가하는 value network, 수행할 행동을 선택하는 policy network를 신경..

AI/Reinforcement Learning 2023.07.03
이전
1
다음
더보기
프로필사진

내 꿈은 척척석사

Per Aspera Ad Astra

  • 분류 전체보기 (19)
    • Math (0)
    • CS (4)
      • DBMS (0)
      • OS (0)
      • CC (1)
      • Crypto (3)
    • Algorithm (9)
      • BOJ (9)
      • Concept (0)
    • AI (2)
      • Reinforcement Learning (2)
      • Computer Vision (0)
      • NLP (0)
    • Code (3)
    • Quantum Learning (0)
    • 취미 (2)
      • 리듬게임 (1)
      • IT (1)

Tag

UCPC, 프림, 플로이드-워셜, 40배열키보드, 크루스칼, 정수론, BFS, 누적합, 우선순위큐, 최소힙, 암호학, 심층강화학습, cudnn, conda 환경변수, 40%배열,

최근글과 인기글

  • 최근글
  • 인기글

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

  • github
  • blog

티스토리툴바