강사 | 박주영 |
제목 | 최신 강화학습 기술의 방법론, 구현 및 미래에 관한 고찰 |
초록 | 깊은 강화학습(Deep Reinforcement Learning)은 현대 인공지능 기술 중 가장 활발한 연구가 이루어지는 분야 중 하나로써, 강화학습, 제어이론 및 딥러닝 기술이 결합되어 시너지 효과를 거두며 급속한 발전을 이루고 있다. 본 강좌에서는 깊은 강화학습 기술의 과거와 현재를 구성하는 주요 주제인 Controlled Ito Process, Stochastic Optimal Control, Hamilton-Jacobi-Bellman Equation, Markov Decision Process, Deep Learning, DQN, Actor-Critic, GAE, DDPG, AlphaGoZero/AlphaZero, Maxent RL, World Model/Planet, Hierarchical Reinforcement Learning 등의 개념을 코딩 기술과 함께 살펴보고, 이와 관련한 미래 기술의 방향에 대해 생각해본다. |
일정표 | Day 1: 이론(Random Walk, Brownian Motion, CLT, SDE, Controlled Ito Process, HJB, MDP, TD, SARSA, Q-Learning, AC 등) + 코딩(Python, PyTorch 기초 및 응용) Day 2: 이론(Deep Learning, PG, DDPG, Bellman Operator, DQN, Rainbow, NAF, AlphaGo Zero, Alpha Zero, Model-based RL, Smoothed Bellman Error Embedding 등) + 코딩(RL 방법론 + 주요 generative models 구현) Day 3: 이론(Maxent RL, SQL, SAC, Twin SAC with entropy constraint 등) + 코딩(Maxent RL 등) |
약력 | ![]() 1992: University of Texas at Austin 전기및컴퓨터공학과 박사 1985: KAIST 석사 1983: 서울대학교 전기공학과 학사 홈페이지 http://sites.google.com/site/rbfpark3 |
필요
라이브러리
|
실습을 위해 다음과 같은 라이브러리가 필요합니다. python3.7, PyTorch 1.1.0(stable), torchvision 0.3.0, Jupyter notebook (0.35.5), Matplotlib (3.1.0) scikit-learn (1.2.1), gym (0.12.5), pandas (0.23.1) |
(06130) 서울시 강남구 테헤란로7길 22(역삼1동 635-4) 과학기술회관 1관 901호
사업자등록번호 : 220-82-01690 / 대표 : 이준호
COPYRIGHT ⓒ KIEE ALL RIGHTS RESERVED.