41. Summary of policy gradients and temporal difference methods (Schulman) - 2

2年前 1446观看

加州大学伯克利分校 2017 深度增强学习课程

大学课程 / 社会学

加州大学伯克利分校 2017 深度增强学习课程

https://www.youtube.com/playlist?list=PLkFD6_40KJIwTmSbCv9OVJB3YaO4sFwkX CS294-112 Deep Reinforcement Learning Sp17 课程主页：http://rll.berkeley.edu/deeprlcourse/

共57集 7.3万人观看