このコースについて

116,417 最近の表示
共有できる証明書
修了時に証明書を取得
100%オンライン
自分のスケジュールですぐに学習を始めてください。
次における4の2コース
柔軟性のある期限
スケジュールに従って期限をリセットします。
中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

約22時間で修了
英語

習得するスキル

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
共有できる証明書
修了時に証明書を取得
100%オンライン
自分のスケジュールですぐに学習を始めてください。
次における4の2コース
柔軟性のある期限
スケジュールに従って期限をリセットします。
中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

約22時間で修了
英語

提供:

Placeholder

アルバータ大学(University of Alberta)

Placeholder

Alberta Machine Intelligence Institute

シラバス - 本コースの学習内容

コンテンツの評価Thumbs Up92%(2,606 件の評価)Info
1

1

1時間で修了

Welcome to the Course!

1時間で修了
2件のビデオ (合計10分), 2 学習用教材
2件のビデオ
Meet your instructors!8 分
2件の学習用教材
Reinforcement Learning Textbook10 分
Read Me: Pre-requisites and Learning Objectives10 分
3時間で修了

Monte Carlo Methods for Prediction & Control

3時間で修了
11件のビデオ (合計58分), 3 学習用教材, 2 個のテスト
11件のビデオ
Using Monte Carlo for Prediction6 分
Using Monte Carlo for Action Values2 分
Using Monte Carlo methods for generalized policy iteration2 分
Solving the Blackjack Example3 分
Epsilon-soft policies5 分
Why does off-policy learning matter?4 分
Importance Sampling4 分
Off-Policy Monte Carlo Prediction5 分
Emma Brunskill: Batch Reinforcement Learning12 分
Week 1 Summary3 分
3件の学習用教材
Module 1 Learning Objectives10 分
Weekly Reading40 分
Chapter Summary40 分
1の練習問題
Graded Quiz30 分
2

2

5時間で修了

Temporal Difference Learning Methods for Prediction

5時間で修了
6件のビデオ (合計37分), 2 学習用教材, 2 個のテスト
6件のビデオ
Rich Sutton: The Importance of TD Learning6 分
The advantages of temporal difference learning5 分
Comparing TD and Monte Carlo5 分
Andy Barto and Rich Sutton: More on the History of RL12 分
Week 2 Summary2 分
2件の学習用教材
Module 2 Learning Objectives10 分
Weekly Reading40 分
1の練習問題
Practice Quiz30 分
3

3

6時間で修了

Temporal Difference Learning Methods for Control

6時間で修了
9件のビデオ (合計30分), 3 学習用教材, 2 個のテスト
9件のビデオ
Sarsa in the Windy Grid World3 分
What is Q-learning?3 分
Q-learning in the Windy Grid World3 分
How is Q-learning off-policy?4 分
Expected Sarsa3 分
Expected Sarsa in the Cliff World3 分
Generality of Expected Sarsa1 分
Week 3 Summary2 分
3件の学習用教材
Module 3 Learning Objectives10 分
Weekly Reading40 分
Chapter summary40 分
1の練習問題
Practice Quiz30 分
4

4

7時間で修了

Planning, Learning & Acting

7時間で修了
11件のビデオ (合計47分), 4 学習用教材, 2 個のテスト
11件のビデオ
Comparing Sample and Distribution Models2 分
Random Tabular Q-planning3 分
The Dyna Architecture5 分
The Dyna Algorithm5 分
Dyna & Q-learning in a Simple Maze5 分
What if the model is inaccurate?3 分
In-depth with changing environments5 分
Drew Bagnell: self-driving, robotics, and Model Based RL7 分
Week 4 Summary1 分
Congratulations!2 分
4件の学習用教材
Module 4 Learning Objectives10 分
Weekly Reading40 分
Chapter Summary40 分
Text Book Part 1 Summary40 分
1の練習問題
Practice Assessment45 分

レビュー

SAMPLE-BASED LEARNING METHODS からの人気レビュー

すべてのレビューを見る

強化学習専門講座について

強化学習

よくある質問

さらに質問がある場合は、受講者向けヘルプセンターにアクセスしてください。