KIEE 학술행사

강화학습 (Reinforcement Learning) 튜토리얼 워크샵

대한전기학회 정보 및 제어 부문회 산하의 자율이동체정보처리연구회와 제어로봇시스템학회 산하의 제어이론연구회 주관으로 강화학습 튜토리업 워크샵을 개최합니다. 
관심 있는 분들의 많은 참여 바랍니다.

일  시: 2019년 8월 5일(월)~7일(수), 9시 30분 – 18시 30분 
장  소: 서울과학기술대학교 테크노큐브동 403호
주  최: (사)대한전기학회 정보 및 제어 부문회, (사)제어로봇시스템학회
강  사: 박주영 (고려대학교 제어계측공학과 교수)
등록비: 학생 30만원, 일반 40만원, 중식 3일 제공 (사전등록만 가능)석사과정까지 학생입니다.
사전등록 마감 : 7월 29일(월)까지
인  원: 45명 선착순  ( (등록취소 22일(월)입니다))
참가자 준비물: 아래 딥러닝 라이브러리가 준비된 개인 노트북 
문  의: 자율이동체 정보처리연구회 위원장 백주훈 (광운대학교 02-940-8387, backhoon@kw.ac.kr)
        대한전기학회 김정훈 팀장 : 02-553-0151, electran@kiee.or.kr

[강의 상세 소개]
강사 박주영
제목 최신 강화학습 기술의 방법론, 구현 및 미래에 관한 고찰
초록 깊은 강화학습(Deep Reinforcement Learning)은 현대 인공지능 기술 중 가장 활발한 연구가 이루어지는 분야 중 하나로써, 강화학습, 제어이론 및 딥러닝 기술이 결합되어 시너지 효과를 거두며 급속한 발전을 이루고 있다. 본 강좌에서는 깊은 강화학습 기술의 과거와 현재를 구성하는 주요 주제인 Controlled Ito Process, Stochastic Optimal Control, Hamilton-Jacobi-Bellman Equation, Markov Decision Process, Deep Learning, DQN, Actor-Critic, GAE, DDPG, AlphaGoZero/AlphaZero, Maxent RL, World Model/Planet, Hierarchical Reinforcement Learning  등의 개념을 코딩 기술과 함께 살펴보고, 이와 관련한 미래 기술의 방향에 대해 생각해본다.
일정표 Day 1: 
이론(Random Walk, Brownian Motion, CLT, SDE, Controlled Ito Process, HJB, MDP, TD, SARSA, Q-Learning, AC 등) + 코딩(Python, PyTorch 기초 및 응용)
Day 2: 
이론(Deep Learning, PG, DDPG, Bellman Operator, DQN, Rainbow, NAF, AlphaGo Zero, Alpha Zero, Model-based RL, Smoothed Bellman Error Embedding 등) + 코딩(RL 방법론 + 주요 generative models 구현)
Day 3: 
이론(Maxent RL, SQL, SAC, Twin SAC with entropy constraint 등) + 코딩(Maxent RL 등)
약력  1993-현재: 고려대학교 제어계측공학과(전자기계융합공학과) 교수
 1992:   University of Texas at Austin 전기및컴퓨터공학과 박사
 1985: KAIST 석사
 1983: 서울대학교 전기공학과   학사
 홈페이지 http://sites.google.com/site/rbfpark3
필요
라이브러리
실습을 위해 다음과 같은 라이브러리가 필요합니다.
python3.7, PyTorch 1.1.0(stable), torchvision 0.3.0, 
Jupyter notebook (0.35.5), Matplotlib (3.1.0)
scikit-learn (1.2.1), gym (0.12.5), pandas (0.23.1)

  • 학회소개
  • 학회주요일정
  • 학회소식
  • 아카이브
  • 논문투고·심사
  • 오시는 길
  • Home
  • Top