このコースについて
7,383 最近の表示

次における4の3コース

100%オンライン

自分のスケジュールですぐに学習を始めてください。

柔軟性のある期限

スケジュールに従って期限をリセットします。

中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

約17時間で修了

推奨:4-6 hours/week...

英語

字幕:英語

習得するスキル

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems

次における4の3コース

100%オンライン

自分のスケジュールですぐに学習を始めてください。

柔軟性のある期限

スケジュールに従って期限をリセットします。

中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

約17時間で修了

推奨:4-6 hours/week...

英語

字幕:英語

このCourseを受講している学習者は

  • Data Scientists
  • Machine Learning Engineers
  • Researchers
  • Financial Analysts
  • Founders

シラバス - 本コースの学習内容

1
4分で修了

Welcome to the Course!

1件のビデオ (合計4分)
1件のビデオ
6時間で修了

On-policy Prediction with Approximation

12件のビデオ (合計61分), 2 quizzes
12件のビデオ
Generalization and Discrimination5 分
Framing Value Estimation as Supervised Learning3 分
The Value Error Objective4 分
Introducing Gradient Descent7 分
Gradient Monte for Policy Evaluation5 分
State Aggregation with Monte Carlo7 分
Semi-Gradient TD for Policy Evaluation3 分
Comparing TD and Monte Carlo with State Aggregation4 分
The Linear TD Update3 分
The True Objective for TD5 分
Week 1 Summary4 分
1の練習問題
On-policy Prediction with Approximation30 分
2
7時間で修了

Constructing Features for Prediction

10件のビデオ (合計43分), 2 quizzes
10件のビデオ
Generalization Properties of Coarse Coding5 分
Tile Coding3 分
Using Tile Coding in TD4 分
What is a Neural Network?3 分
Non-linear Approximation with Neural Networks4 分
Deep Neural Networks3 分
Gradient Descent for Training Neural Networks8 分
Optimization Strategies for NNs4 分
Week 2 Review2 分
1の練習問題
Constructing Features for Prediction28 分
3
5時間で修了

Control with Approximation

6件のビデオ (合計28分), 1 reading, 2 quizzes
6件のビデオ
Episodic Sarsa in Mountain Car5 分
Expected Sarsa with Function Approximation2 分
Exploration under Function Approximation3 分
Average Reward: A New Way of Formulating Control Problems10 分
Week 3 Review2 分
1件の学習用教材
Weekly Reading40 分
1の練習問題
Practice Quiz
4
6時間で修了

Policy Gradient

10件のビデオ (合計53分), 1 reading, 2 quizzes
10件のビデオ
Advantages of Policy Parameterization5 分
The Objective for Learning Policies5 分
The Policy Gradient Theorem5 分
Estimating the Policy Gradient4 分
Actor-Critic Algorithm5 分
Actor-Critic with Softmax Policies3 分
Demonstration with Actor-Critic6 分
Gaussian Policies for Continuous Actions7 分
Week 4 Summary3 分
1件の学習用教材
Weekly Reading10 分
1の練習問題
Policy Gradient Methods30 分

講師

Avatar

Martha White

Assistant Professor
Computing Science
Avatar

Adam White

Assistant Professor
Computing Science

アルバータ大学(University of Alberta)について

UAlberta is considered among the world’s leading public research- and teaching-intensive universities. As one of Canada’s top universities, we’re known for excellence across the humanities, sciences, creative arts, business, engineering and health sciences....

Alberta Machine Intelligence Instituteについて

The Alberta Machine Intelligence Institute (Amii) is home to some of the world’s top talent in machine intelligence. We’re an Alberta-based research institute that pushes the bounds of academic knowledge and guides business understanding of artificial intelligence and machine learning....

強化学習専門講座について

The Reinforcement Learning Specialization consists of 4 courses exploring the power of adaptive learning systems and artificial intelligence (AI). Harnessing the full potential of artificial intelligence requires adaptive learning systems. Learn how Reinforcement Learning (RL) solutions help solve real-world problems through trial-and-error interaction by implementing a complete RL solution from beginning to end. By the end of this Specialization, learners will understand the foundations of much of modern probabilistic artificial intelligence (AI) and be prepared to take more advanced courses or to apply AI tools and ideas to real-world problems. This content will focus on “small-scale” problems in order to understand the foundations of Reinforcement Learning, as taught by world-renowned experts at the University of Alberta, Faculty of Science. The tools learned in this Specialization can be applied to game development (AI), customer interaction (how a website interacts with customers), smart assistants, recommender systems, supply chain, industrial control, finance, oil & gas pipelines, industrial control systems, and more....
強化学習

よくある質問

  • 修了証に登録すると、すべてのビデオ、テスト、およびプログラミング課題(該当する場合)にアクセスできます。ピアレビュー課題は、セッションが開始してからのみ、提出およびレビューできます。購入せずにコースを検討することを選択する場合、特定の課題にアクセスすることはできません。

  • コースに登録する際、専門講座のすべてのコースにアクセスできます。コースの完了時には修了証を取得できます。電子修了証が成果のページに追加され、そこから修了証を印刷したり、LinkedInのプロフィールに追加したりできます。コースの内容の閲覧のみを希望する場合は、無料でコースを聴講できます。

さらに質問がある場合は、受講者向けヘルプセンターにアクセスしてください。