Sergey Lecture Remake in Japanese
sergeyの授業を日本語でまとめたものになります.
参考資料 http://rail.eecs.berkeley.edu/deeprlcourse-fa18/
参考動画 https://www.youtube.com/playlist?list=PLkFD6_40KJIxJMR-j5A1mkxK26gh_qg37
Introduction and Course Overview
- 深層強化学習とは?
- 深層強化学習を使う意味とは?
Supervised Learning of behaviors
- 模倣学習とは?
- 模倣学習の研究の変遷
- 模倣学習の数学的な解析(Daggerの論文より)
- Control as Infererenceとは?
- 強化学習問題におけるグラフィカルモデルの導入
- 変分推論を用いたMaxEntRL
- Soft-Q learning、Max Ent policy gradientへの繋がり
- 逆強化学習とは?
- MaxEnt Inverse RLの導入
- MaxEnt Inverse RLの難しさとその改善方法
- Guided Cost Learningとは?
- Guided Cost LearningとGANの繋がり