このコースについて

113,710 最近の表示
柔軟性のある期限
スケジュールに従って期限をリセットします。
共有できる証明書
修了時に証明書を取得
100%オンライン
自分のスケジュールですぐに学習を始めてください。
次における4の1コース
中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

約15時間で修了
英語

学習内容

  • Formalize problems as Markov Decision Processes

  • Understand basic exploration methods and the exploration / exploitation tradeoff

  • Understand value functions, as a general-purpose tool for optimal decision-making

  • Know how to implement dynamic programming as an efficient solution approach to an industrial control problem

習得するスキル

Artificial Intelligence (AI)Machine LearningReinforcement LearningFunction ApproximationIntelligent Systems
柔軟性のある期限
スケジュールに従って期限をリセットします。
共有できる証明書
修了時に証明書を取得
100%オンライン
自分のスケジュールですぐに学習を始めてください。
次における4の1コース
中級レベル

Probabilities & Expectations, basic linear algebra, basic calculus, Python 3.0 (at least 1 year), implementing algorithms from pseudocode.

約15時間で修了
英語

提供:

Placeholder

アルバータ大学(University of Alberta)

Placeholder

Alberta Machine Intelligence Institute

シラバス - 本コースの学習内容

コンテンツの評価Thumbs Up93%(14,990 件の評価)Info
1

1

1時間で修了

Welcome to the Course!

1時間で修了
4件のビデオ (合計20分), 2 学習用教材
4時間で修了

An Introduction to Sequential Decision-Making

4時間で修了
8件のビデオ (合計46分), 3 学習用教材, 2 個のテスト
2

2

3時間で修了

Markov Decision Processes

3時間で修了
7件のビデオ (合計36分), 2 学習用教材, 2 個のテスト
3

3

3時間で修了

Value Functions & Bellman Equations

3時間で修了
9件のビデオ (合計56分), 3 学習用教材, 2 個のテスト
4

4

4時間で修了

Dynamic Programming

4時間で修了
10件のビデオ (合計72分), 3 学習用教材, 2 個のテスト

レビュー

FUNDAMENTALS OF REINFORCEMENT LEARNING からの人気レビュー

すべてのレビューを見る

強化学習専門講座について

強化学習

よくある質問

さらに質問がある場合は、受講者向けヘルプセンターにアクセスしてください。