Chevron Left
Sample-based Learning Methods(으)로 돌아가기

앨버타 대학교의 Sample-based Learning Methods 학습자 리뷰 및 피드백

1,136개의 평가

강좌 소개

In this course, you will learn about several algorithms that can learn near optimal policies based on trial and error interaction with the environment---learning from the agent’s own experience. Learning from actual experience is striking because it requires no prior knowledge of the environment’s dynamics, yet can still attain optimal behavior. We will cover intuitively simple but powerful Monte Carlo methods, and temporal difference learning methods including Q-learning. We will wrap up this course investigating how we can get the best of both worlds: algorithms that can combine model-based planning (similar to dynamic programming) and temporal difference updates to radically accelerate learning. By the end of this course you will be able to: - Understand Temporal-Difference learning and Monte Carlo as two strategies for estimating value functions from sampled experience - Understand the importance of exploration, when using sampled experience rather than dynamic programming sweeps within a model - Understand the connections between Monte Carlo and Dynamic Programming and TD. - Implement and apply the TD algorithm, for estimating value functions - Implement and apply Expected Sarsa and Q-learning (two TD methods for control) - Understand the difference between on-policy and off-policy control - Understand planning with simulated experience (as opposed to classic planning strategies) - Implement a model-based approach to RL, called Dyna, which uses simulated experience - Conduct an empirical study to see the improvements in sample efficiency when using Dyna...

최상위 리뷰


2021년 2월 14일

Excellent course that naturally extends the first specialization course. The application examples in programming are very good and I loved how RL gets closer and closer to how a living being thinks.


2020년 8월 11일

Great course, giving it 5 stars though it deserves both because the assignments have some serious issues that shouldn't actually be a matter. All the other parts are amazing though. Good job

필터링 기준:

Sample-based Learning Methods의 221개 리뷰 중 1~25

교육 기관: JD

2019년 9월 22일

교육 기관: Kaiwen Y

2019년 10월 2일

교육 기관: hope

2020년 1월 25일

교육 기관: Juan C E

2020년 3월 7일

교육 기관: Maxim V

2020년 1월 12일

교육 기관: Bernard C

2020년 3월 22일

교육 기관: Rishi R

2020년 8월 3일

교육 기관: Mukund C

2020년 3월 17일

교육 기관: Kinal M

2020년 1월 10일

교육 기관: Kyle A

2019년 10월 3일

교육 기관: Ivan S F

2019년 9월 29일

교육 기관: Manuel B

2019년 11월 28일

교육 기관: Amit J

2021년 2월 27일

교육 기관: Manuel V d S

2019년 10월 4일

교육 기관: Andrew G

2019년 12월 24일

교육 기관: Maximiliano B

2020년 2월 23일

교육 기관: Jonathan B

2020년 5월 9일

교육 기관: Steven W

2021년 5월 11일

교육 기관: Sandesh J

2020년 6월 8일

교육 기관: César S

2021년 7월 9일

교육 기관: Yover M C C

2020년 4월 22일

교육 기관: Alberto H

2019년 10월 28일

교육 기관: Karol P

2021년 4월 9일

교육 기관: Pars V

2020년 1월 5일

교육 기관: Surya K

2020년 4월 12일