このコースについて
38,286 最近の表示

100%オンライン

自分のスケジュールですぐに学習を始めてください。

柔軟性のある期限

スケジュールに従って期限をリセットします。

中級レベル

約25時間で修了

推奨:4 недели обучения, через 3-5 часа / неделю...

ロシア語

字幕:ロシア語

習得するスキル

Topic ModelData Clustering AlgorithmsMachine LearningData Visualization (DataViz)

100%オンライン

自分のスケジュールですぐに学習を始めてください。

柔軟性のある期限

スケジュールに従って期限をリセットします。

中級レベル

約25時間で修了

推奨:4 недели обучения, через 3-5 часа / неделю...

ロシア語

字幕:ロシア語

シラバス - 本コースの学習内容

1
7時間で修了

Кластеризация

Добро пожаловать на курс "Поиск структуры в данных"! В этом курсе вы узнаете про задачи машинного обучения, в которых требуется не предсказать целевую переменную, а найти некоторые внутренние закономерности в данных — например, сгруппировать объекты по схожести, или определить наиболее важные признаки. В первом модуле мы изучим задачу кластеризации, направленную на поиск групп близких объектов. Вы узнаете про основные подходы к её решению, а также узнаете, как можно выбрать хороший алгоритм кластеризации, не имея правильных ответов.

...
15件のビデオ (合計109分), 8 readings, 5 quizzes
15件のビデオ
Как устроена специализация, и зачем ее проходить3 分
Структура уроков1 分
Задача кластеризации4 分
Примеры задач кластеризации5 分
Знакомство с методами кластеризации9 分
Пример: кластеризация текстов по теме13 分
Выбор метода кластеризации7 分
МФТИ1 分
Метод K средних (K-Means)10 分
Expectation Maximization (EM-алгоритм)9 分
Агломеративная иерархическая кластеризация12 分
Графовые методы кластеризации4 分
Методы, основанные на плотности6 分
Оценка качества и рекомендации по решению задачи кластеризации13 分
8件の学習用教材
Блокнот из примера кластеризации текстов20 分
Слайды к лекциям10 分
Конспект10 分
Немного о Yandex10 分
МФТИ10 分
Forum&Chat10 分
Слайды к лекциям10 分
Конспект10 分
4の練習問題
Знакомство с кластеризацией6 分
Введение в кластеризацию8 分
Некоторые методы кластеризации8 分
Подробнее о методах кластеризации12 分
2
6時間で修了

Понижение размерности и матричные разложения

В предыдущем модуле мы обсуждали, как кластеризовать объекты, а в этом модуле займёмся признаками. Нередко возникают ситуации, в которых далеко не все признаки нужны для решения задачи — или же нужны все, но при этом их слишком много. В этом случае нужно перейти в новое признаковое пространство меньшей размерности. Для этого можно либо отбирать наиболее важные признаки, либо порождать новые на основе исходных — мы обсудим оба подхода. В частности, мы разберёмся с методом главных компонент, который используется в самых разных задачах машинного обучения. Затем мы перейдём к матричным разложениям — мы изучим несколько методов, позволяющих получить приближение исходной матрицы в виде произведения нескольких матриц меньшей размерности. Такая аппроксимация часто используется в задачах машинного обучения, например, для понижения размерности данных, восстановления пропущенных значений в матрицах и построения рекомендательных систем.

...
15件のビデオ (合計108分), 4 readings, 5 quizzes
15件のビデオ
Одномерный отбор признаков8 分
Жадные методы отбора признаков6 分
Отбор признаков на основе моделей6 分
Понижение размерности4 分
Метод главных компонент: постановка задачи7 分
Метод главных компонент: решение6 分
Матричные разложения13 分
SGD и ALS5 分
Прогнозирование неизвестных значений в матрице6 分
Проблема отсутствия негативных примеров и implicit методы6 分
Вероятностный взгляд на матричные разложения5 分
Неотрицательные матричные разложения: постановка и решение10 分
Неотрицательные матричные разложения: функционалы и инициализация5 分
Обработка пропусков8 分
4件の学習用教材
Слайды к лекциям10 分
Конспект10 分
Слайды к лекциям10 分
Конспект10 分
4の練習問題
Отбор признаков6 分
Понижение размерности и отбор признаков14 分
Матричные разложения8 分
Неотрицательные матричные разложения10 分
3
4時間で修了

Визуализация и поиск аномалий

Добро пожаловать на третью неделю курса! В ней мы обсудим две задачи: обнаружение аномалий и визуализация данных. Обнаружение аномалий направлено на поиск объектов, которые являются особенными в некотором смысле. Например, это могут объекты с такими значениями признаков, которые далеки от имеющихся в обучающей выборке — вполне ожидаемо, что на таких объектах модель выдаст очень плохие прогнозы. Вы узнаете, как можно формально дать определение аномалий и с помощью каких методов можно решать задачу их поиска. Вторая задача, о которой мы поговорим — это визуализация, то есть отображение многомерной выборки в пространство размерности два или три. В теории визуализация близка к понижению размерности — но за счёт того, что нам нужно найти всего два или три признака, можно использовать очень сложные нелинейные методы.

...
8件のビデオ (合計57分), 5 readings, 5 quizzes
8件のビデオ
Параметрическое восстановление плотности9 分
Непараметрическое восстановление плотности8 分
Одноклассовый SVM5 分
Задача визуализации5 分
Многомерное шкалирование4 分
Метод t-SNE6 分
Визуализация данных в sklearn12 分
5件の学習用教材
Слайды к лекциям10 分
Конспект10 分
Визуализация данных в sklearn10 分
Слайды к лекциям10 分
Конспект10 分
4の練習問題
Восстановление плотности6 分
Поиск аномалий4 分
Методы SNE и t-SNE6 分
Визуализация14 分
4
10時間で修了

Тематическое моделирование

Люди уже много веков сохраняют свои знания в виде книг, а крупнейшая на сегодняшний день коллекция информации — Интернет — состоит из огромного количества текстов. Тексты, по сути, являются наиболее популярным видом данных, и поэтому очень важно уметь искать в них закономерности. Тематическое моделирование — это способ семантического анализа коллекции текстовых документов. Тематическая модель позволяет для каждого документа найти темы, которые его описывают, и кроме того показывает, какие слова характеризуют ту или иную тему. Другими словами, мы находим более компактное представление большого набора текстов в виде нескольких тем. С математической точки зрения тематическая модель — это еще один вид матричного разложения, где в качестве исходной матрицы выступает матрица частот слов в документах. На четвертой неделе мы поговорим о том, где применяют тематические модели, какие они бывают, как их строить и как оценивать.

...
14件のビデオ (合計151分), 8 readings, 6 quizzes
14件のビデオ
Постановка задачи тематического моделирования12 分
Базовые тематические модели и EM-алгоритм14 分
Регуляризация тематических моделей10 分
Мультимодальные тематические модели9 分
Внутренние критерии качества тематических моделей9 分
Внешние критерии качества тематических моделей16 分
Визуализация тематических моделей10 分
Тематические модели на практике11 分
Пример использования библиотеки gensim для построения тематической модели10 分
Установка BigARTM в Windows3 分
Установка BigARTM в Linux Mint2 分
Установка BigARTM в Mac OS-X3 分
Пример использования библиотеки BigARTM для построения тематической модели19 分
8件の学習用教材
Слайды к лекциям10 分
Конспект10 分
Ноутбук из демонстрации использования gensim10 分
Ноутбук из демонстрации использования BigARTM10 分
Слайды к лекциям10 分
Конспект10 分
Финальные титры10 分
Стань ментором специализации10 分
4の練習問題
Постановка задачи и базовые понятия6 分
Тематическое моделирование-18 分
Критерии качества тематических моделей6 分
Тематическое моделирование-26 分
4.7
110件のレビューChevron Right

71%

コース終了後に新しいキャリアをスタートした

56%

コースが具体的なキャリアアップにつながった

25%

昇給や昇進につながった

Поиск структуры в данных からの人気レビュー

by PKMay 4th 2018

Отличный вводный курс, как и вся специализация. Доступно и понятно изложены все базовые вещи, которые могут потребоваться в повседневной деятельности в качестве data scientist.

by AAJan 9th 2017

Интересный курс, замечательные преподаватели. Есть моменты когда лекция довольно сложная, а тест простой, это оставляет тревожное ощущение недоученности :)

講師

Avatar

Константин Воронцов

доктор физико-математических наук, профессор
Кафедра интеллектуальных систем

モスクワ物理工科大学(Moscow Institute of Physics and Technology)について

Московский физико-технический институт (Физтех) является одним из ведущих вузов страны и входит в основные рейтинги лучших университетов мира. Институт обладает не только богатой историей – основателями и профессорами института были Нобелевские лауреаты Пётр Капица, Лев Ландау и Николай Семенов – но и большой научно-исследовательской базой. Основой образования в МФТИ является уникальная «система Физтеха», сформулированная Петром Капицей: кропотливый отбор одаренных и склонных к творческой работе абитуриентов; участие в обучении ведущих научных работников; индивидуальный подход к отдельным студентам с целью развития их творческих задатков; воспитание с первых шагов в атмосфере технических исследований и конструктивного творчества с использованием потенциала лучших лабораторий страны. Среди выпускников МФТИ — нобелевские лауреаты Андрей Гейм и Константин Новоселов, основатель компании ABBYY Давид Ян, один из авторов архитектурных принципов построения вычислительных комплексов Борис Бабаян и др....

Yandexについて

Yandex is a technology company that builds intelligent products and services powered by machine learning. Our goal is to help consumers and businesses better navigate the online and offline world....

Машинное обучение и анализ данныхの専門講座について

Мы покажем, как проходит полный цикл анализа, от сбора данных до выбора оптимального решения и оценки его качества. Вы научитесь пользоваться современными аналитическими инструментами и адаптировать их под особенности конкретных задач. В рамках специализации вы освоите основные темы, необходимые в работе с большим массивом данных, в т.ч. современные методы классификации и регрессии, поиск структуры в данных, проведение экспериментов, построение выводов, базовая фундаментальная математика, основы программирования на Python. Мы разберём, как построить рекомендательную систему, оценить эмоциональную окраску текста, спрогнозировать спрос на товар, оценить вероятность клика по рекламе и т.д. В финале вам потребуется выполнить проект собственной системы, решающей любую актуальную для бизнеса задачу. Результатом будет наглядная работающая модель, которую вы сможете использовать в вашей повседневной работе или продемонстрировать на собеседовании. Все, прошедшие специализацию, могут принять участие в Программе трудоустройства. Если вы заинтересованы в новых проектах, новых перспективах и возможностях - пройдите обучение по Специализации и подайте заявку....
Машинное обучение и анализ данных

よくある質問

  • 修了証に登録すると、すべてのビデオ、テスト、およびプログラミング課題(該当する場合)にアクセスできます。ピアレビュー課題は、セッションが開始してからのみ、提出およびレビューできます。購入せずにコースを検討することを選択する場合、特定の課題にアクセスすることはできません。

  • コースに登録する際、専門講座のすべてのコースにアクセスできます。コースの完了時には修了証を取得できます。電子修了証が成果のページに追加され、そこから修了証を印刷したり、LinkedInのプロフィールに追加したりできます。コースの内容の閲覧のみを希望する場合は、無料でコースを聴講できます。

さらに質問がある場合は、受講者向けヘルプセンターにアクセスしてください。