このコースについて

109,519 最近の表示
共有できる証明書
修了時に証明書を取得
100%オンライン
自分のスケジュールですぐに学習を始めてください。
次における4の2コース
柔軟性のある期限
スケジュールに従って期限をリセットします。
中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

約28時間で修了
英語
字幕:英語

習得するスキル

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
共有できる証明書
修了時に証明書を取得
100%オンライン
自分のスケジュールですぐに学習を始めてください。
次における4の2コース
柔軟性のある期限
スケジュールに従って期限をリセットします。
中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode

約28時間で修了
英語
字幕:英語

提供:

アルバータ大学(University of Alberta) ロゴ

アルバータ大学(University of Alberta)

Alberta Machine Intelligence Institute ロゴ

Alberta Machine Intelligence Institute

シラバス - 本コースの学習内容

コンテンツの評価Thumbs Up92%(2,208 件の評価)Info
1

1

1時間で修了

Welcome to the Course!

1時間で修了
2件のビデオ (合計10分), 2 readings
2件のビデオ
Meet your instructors!8 分
2件の学習用教材
Reinforcement Learning Textbook10 分
Read Me: Pre-requisites and Learning Objectives10 分
2

2

4時間で修了

Monte Carlo Methods for Prediction & Control

4時間で修了
11件のビデオ (合計58分), 2 readings, 1 quiz
11件のビデオ
Using Monte Carlo for Prediction6 分
Using Monte Carlo for Action Values2 分
Using Monte Carlo methods for generalized policy iteration2 分
Solving the Blackjack Example3 分
Epsilon-soft policies5 分
Why does off-policy learning matter?4 分
Importance Sampling4 分
Off-Policy Monte Carlo Prediction5 分
Emma Brunskill: Batch Reinforcement Learning12 分
Week 1 Summary3 分
2件の学習用教材
Weekly Reading40 分
Chapter Summary40 分
1の練習問題
Graded Quiz30 分
3

3

6時間で修了

Temporal Difference Learning Methods for Prediction

6時間で修了
6件のビデオ (合計37分), 1 reading, 2 quizzes
6件のビデオ
Rich Sutton: The Importance of TD Learning6 分
The advantages of temporal difference learning5 分
Comparing TD and Monte Carlo5 分
Andy Barto and Rich Sutton: More on the History of RL12 分
Week 2 Summary2 分
1件の学習用教材
Weekly Reading40 分
1の練習問題
Practice Quiz30 分
4

4

8時間で修了

Temporal Difference Learning Methods for Control

8時間で修了
9件のビデオ (合計30分), 2 readings, 2 quizzes
9件のビデオ
Sarsa in the Windy Grid World3 分
What is Q-learning?3 分
Q-learning in the Windy Grid World3 分
How is Q-learning off-policy?4 分
Expected Sarsa3 分
Expected Sarsa in the Cliff World3 分
Generality of Expected Sarsa1 分
Week 3 Summary2 分
2件の学習用教材
Weekly Reading40 分
Chapter summary40 分
1の練習問題
Practice Quiz30 分

レビュー

SAMPLE-BASED LEARNING METHODS からの人気レビュー

すべてのレビューを見る

強化学習専門講座について

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
強化学習

よくある質問

  • 講義と課題へのアクセスは、登録のタイプによって異なります。聴講モードでコースを受講すると、ほとんどのコース教材を無料で見ることができます。採点された課題にアクセスして修了証を取得するには、聴講中または聴講後に、修了証エクスペリエンスを購入する必要があります。聴講オプションが表示されない場合:

    • コースは聴講オプションを提供していない可能性があります。代わりに無料トライアルをお試しいただくか、学資援助を申請することができます。
    • コースは、聴講オプションを提供せずに「修了証なしフルコース」オプションを提供する場合があります。このオプションでは、すべてのコース教材が表示され、必須の評価を提出して、最終成績を取得することができます。この場合、修了証エクスペリエンスは購入できません。
  • コースに登録する際、専門講座のすべてのコースにアクセスできます。コースの完了時には修了証を取得できます。電子修了証が成果のページに追加され、そこから修了証を印刷したり、LinkedInのプロフィールに追加したりできます。コースの内容の閲覧のみを希望する場合は、無料でコースを聴講できます。

  • サブスクライブすると、7日間の無料トライアルを体験できます。この期間中は解約金なしでキャンセルできます。それ以降、払い戻しはありませんが、サブスクリプションをいつでもキャンセルできます。返金ポリシーをすべて表示します

  • はい。受講料の支払いが難しい受講生に、Coursera(コーセラ)は学資援助を提供しています。左側の[登録]ボタンの下にある[学資援助]のリンクをクリックして申請してください。申請書の入力を促すメッセージが表示され、承認されると通知が届きます。キャップストーンプロジェクトを含む専門講座の各コースでこのステップを完了する必要があります。詳細

さらに質問がある場合は、受講者向けヘルプセンターにアクセスしてください。