Skip to content

Latest commit

 

History

History
70 lines (63 loc) · 4.09 KB

README.md

File metadata and controls

70 lines (63 loc) · 4.09 KB

AI Robotics KR - CS294 스터디 Repository

image_link

스터디 소개:

  • 목적: UC Berkeley의 2018년도 CS294 강의 자료와 "파이썬과 케라스로 배우는 강화학습" 자료를 기반으로 심층강화학습에 대해 공부하기.
  • 기간: 2019년 8월 ~ 2020년 1월 (종료일 미확정)
  • 참여자: 양정아, 김승원, 김충희, 김한준, 이동섭, 이정연, 이해중, 전효정, 최시현, 최윤규, 최원우, 황태준
  • 기획 그룹: AI Robotics KR

스터디 진행 방법 / Repository 사용법:

  • 강의 리뷰 : 3인 1팀 구성, 1주 1강씩 강의 리뷰 발표
  • 코딩 : 강의 진도에 맞춰서 예제 코드 진행
  • 리뷰 발표 자료, 질의 응답 관련된 내용은 당일 발표 팀에서 정리해서 깃허브에 업로드

팀 구성

  • pytorch

    • 최시현, 이동섭, 양정아
    • 황태준, 이정연, 김충희
  • tensorflow & keras

    • 최원우, 전효정, 김승원
    • 이해중, 최윤규, 김한준

무단 결석 & 지각 벌금

Deposit : 3만원 무단 결석(당일 취소) 시 만원 차감

지각

  • 10분 : 2000원
  • 30분 : 3000원
  • 1시간 이후 : 5000원

스터디 진도표

스터디 내용 날짜와 시간 발표자
Lecture 2: Supervised Learning and Imitation 19/08/29 이해중, 최윤규, 김한준
Lecture 4: Reinforcement Learning Introduction 19/09/05 황태준, 이정연, 김충희
Lecture 5: Policy Gradients Introduction 19/09/19 최원우, 전효정, 김승원
Lecture 6: Actor-Critic Introduction 19/09/26 최시현, 이동섭, 양정아
Lecture 7: Value Functions and Q-Learning 19/10/03 이해중, 최윤규, 김한준
Lecture 8: Advanced Q-Learning Algorithms 19/10/10 황태준, 이정연, 김충희
Lecture 9: Advanced Policy Gradients 19/10/17 최원우, 전효정, 김승원
Lecture 10: Optimal Control and Planning 19/10/24 최시현, 이동섭, 양정아
Lecture 11: Model-Based Reinforcement Learning 19/10/31 이해중, 최윤규, 김한준
Lecture 12: Advanced Model Learning and Images 19/11/07 황태준, 이정연, 김충희
Lecture 13: Learning Policies by Imitating Other Policies 19/11/14 최원우, 전효정, 김승원
Lecture 14: Probability and Variational Inference Primer 19/11/21 최시현, 이동섭, 양정아
Lecture 15: Connection between Inference and Control 19/11/28 이해중, 최윤규, 김한준
Lecture 16: Inverse Reinforcement Learning 19/12/05 황태준, 이정연, 김충희
Lecture 17: Exploration: Part 1 19/12/12 최원우, 전효정, 김승원
Lecture 18: Exploration: Part 2 19/12/19 최시현, 이동섭, 양정아
Lecture 19: Transfer Learning and Multi-Task Learning 19/12/26 이해중, 최윤규, 김한준
Lecture 20: Meta-Learning 19/01/02 황태준, 이정연, 김충희
Lecture 21: Parallelism and RL System Design 19/01/09 최원우, 전효정, 김
Lecture 22: Advanced Imitation Learning and Open Problems 19/01/16 최시현, 이동섭, 양정아

CS294 스터디 안내

- 오프라인으로 매주 목요일 19시 30분~ 21시 30분에 진행됩니다. (2019.08 ~ 2020.01)
- 스터디 형식: 매주 돌아가면서 그 주의 조가 준비한 자료를 참고해서 이론 공부 + 실습 + 질의응답 및 토론 
- 이론 공부 자료: 
- [Lecture Slides](http://rail.eecs.berkeley.edu/deeprlcourse-fa18/)
- 질의 응답: 강의 내용과 관련해 서로 질문하고 의견을 공유합니다.

유용한 링크 모음