- 목적: UC Berkeley의 2018년도 CS294 강의 자료와 "파이썬과 케라스로 배우는 강화학습" 자료를 기반으로 심층강화학습에 대해 공부하기.
- 기간: 2019년 8월 ~ 2020년 1월 (종료일 미확정)
- 참여자: 양정아, 김승원, 김충희, 김한준, 이동섭, 이정연, 이해중, 전효정, 최시현, 최윤규, 최원우, 황태준
- 기획 그룹: AI Robotics KR
- 강의 리뷰 : 3인 1팀 구성, 1주 1강씩 강의 리뷰 발표
- 코딩 : 강의 진도에 맞춰서 예제 코드 진행
- 리뷰 발표 자료, 질의 응답 관련된 내용은 당일 발표 팀에서 정리해서 깃허브에 업로드
-
pytorch
- 최시현, 이동섭, 양정아
- 황태준, 이정연, 김충희
-
tensorflow & keras
- 최원우, 전효정, 김승원
- 이해중, 최윤규, 김한준
Deposit : 3만원 무단 결석(당일 취소) 시 만원 차감
- 10분 : 2000원
- 30분 : 3000원
- 1시간 이후 : 5000원
스터디 내용 | 날짜와 시간 | 발표자 |
---|---|---|
Lecture 2: Supervised Learning and Imitation | 19/08/29 | 이해중, 최윤규, 김한준 |
Lecture 4: Reinforcement Learning Introduction | 19/09/05 | 황태준, 이정연, 김충희 |
Lecture 5: Policy Gradients Introduction | 19/09/19 | 최원우, 전효정, 김승원 |
Lecture 6: Actor-Critic Introduction | 19/09/26 | 최시현, 이동섭, 양정아 |
Lecture 7: Value Functions and Q-Learning | 19/10/03 | 이해중, 최윤규, 김한준 |
Lecture 8: Advanced Q-Learning Algorithms | 19/10/10 | 황태준, 이정연, 김충희 |
Lecture 9: Advanced Policy Gradients | 19/10/17 | 최원우, 전효정, 김승원 |
Lecture 10: Optimal Control and Planning | 19/10/24 | 최시현, 이동섭, 양정아 |
Lecture 11: Model-Based Reinforcement Learning | 19/10/31 | 이해중, 최윤규, 김한준 |
Lecture 12: Advanced Model Learning and Images | 19/11/07 | 황태준, 이정연, 김충희 |
Lecture 13: Learning Policies by Imitating Other Policies | 19/11/14 | 최원우, 전효정, 김승원 |
Lecture 14: Probability and Variational Inference Primer | 19/11/21 | 최시현, 이동섭, 양정아 |
Lecture 15: Connection between Inference and Control | 19/11/28 | 이해중, 최윤규, 김한준 |
Lecture 16: Inverse Reinforcement Learning | 19/12/05 | 황태준, 이정연, 김충희 |
Lecture 17: Exploration: Part 1 | 19/12/12 | 최원우, 전효정, 김승원 |
Lecture 18: Exploration: Part 2 | 19/12/19 | 최시현, 이동섭, 양정아 |
Lecture 19: Transfer Learning and Multi-Task Learning | 19/12/26 | 이해중, 최윤규, 김한준 |
Lecture 20: Meta-Learning | 19/01/02 | 황태준, 이정연, 김충희 |
Lecture 21: Parallelism and RL System Design | 19/01/09 | 최원우, 전효정, 김 |
Lecture 22: Advanced Imitation Learning and Open Problems | 19/01/16 | 최시현, 이동섭, 양정아 |
- 오프라인으로 매주 목요일 19시 30분~ 21시 30분에 진행됩니다. (2019.08 ~ 2020.01)
- 스터디 형식: 매주 돌아가면서 그 주의 조가 준비한 자료를 참고해서 이론 공부 + 실습 + 질의응답 및 토론
- 이론 공부 자료:
- [Lecture Slides](http://rail.eecs.berkeley.edu/deeprlcourse-fa18/)
- 질의 응답: 강의 내용과 관련해 서로 질문하고 의견을 공유합니다.