[МУЗЫКА] [МУЗЫКА] Настало время подвести итоги этого модуля. Мы с вами узнали, что вокруг нас есть множество случайных величин, которые не подчиняются нормальному распределению, с которым мы привыкли работать. И некоторые из этих случайных величин подчиняются другим распределениям, которые принадлежат большому семейству экспоненциальных распределений. Для мерных данных мы теперь знаем, что могут подойти не только нормальные распределения, но, например, и гамма-распределение, которое будет учитывать увеличение разброса с увеличением среднего значения. Для бинарных данных для моделирования каких-то дискретных исходов очень подходит биномиальное распределение. Для счетных данных мы можем использовать распределение Пуассона или отрицательное биномиальное распределение в зависимости от того, насколько сильно и каким образом дисперсия связана со средним, то есть для всякой практической величины у нас теперь найдется в арсенале какой-то свой метод, какое-то распределение, с помощью которого мы сможем эту величину смоделировать. Обобщенные линейные модели позволяют нам моделировать не только переменные-отклики, которые подчиняются нормальному распределению, как это делала простая линейная регрессия. Теперь с их помощью, с помощью generalized linear models, мы сможем превозмочь это ограничение на распределение отклика и использовать другие распределения из семейства экспоненциальных. В обобщенных линейных моделях появляются новые элементы, появляется функция связи, которая помогает нам переводить матожидание отклика в значение линейного предиктора, появляется обратная ей функция, и параметры таких моделей мы подбираем при помощи метода максимального правдоподобия. Соответственно тестирование значимости параметров таких моделей, тестирование значимости самих моделей тоже будет немного отличаться от того, что мы имели в обычной линейной регрессии. Для тестирования обычных предикторов можно использовать, конечно, аналогичные методы, тесты Вальда, которые очень похожи на t-тесты в линейной регрессии. Но помните, что эти тесты приблизительны, они лучше всего работают на больших выборках, и аккуратнее смотрите на их результаты. Если вы получаете значения уровня значимости, близкие к пороговому значению, то, наверное, стоит к такому результату относиться с осторожностью. Второй метод, который используется для тестирования гипотез в обобщенных линейных моделях, это совершенно новая для нас штука, это тесты отношения правдоподобий. Они более точны, хотя тоже асимптотически. Один из способов оценить качество подгонки обобщенных линейных моделей, поскольку они подобраны методом максимального правдоподобия, он тоже будет связан с правдоподобиями. Мы можем посчитать долю объясненной девиансы. И эта мера — это аналог коэффициента детерминации R квадрат, который у нас был в простых линейных моделях. Сейчас мы разобрались практически со всем аппаратом, который применяется для анализа обобщенных линейных моделей, и теперь мы готовы к тому, чтобы эти результаты применять дальше с другими распределениями, не только с нормальным распределением. Как вы видели, обобщенная линейная модель, в которой мы подразумеваем, что отклик подчиняется нормальному распределению, она очень похожа на то, как выглядела простая линейная модель. И это вам не просто показалось, это действительно так. То есть результаты оценки коэффициентов будут совпадать. Единственная вещь, которая не будет совпадать, это оценка дисперсии, то есть сигма, оцененная при помощи метода максимального правдоподобия, будет немного смещена, но сейчас нас это не смущает, потому что это не главный фокус для нашего интереса. То есть мы заинтересованы в оценке фиксированных параметров, а не сигмы, поэтому максимальное правдоподобие нас вполне устраивает. По-настоящему, конечно, обобщенные линейные модели нужны для моделирования величин, которые не подчиняются нормальному распределению. Так что сегодня, считайте, что мы играли как будто бы в песочнице с этими гауссовскими моделями. А вот в следующих модулях начнутся вещи более интересные. Там мы познакомимся с тем, как моделировать бинарные, счетные величины. Когда вы моделируете эти величины, у вас весь ход анализа немного меняется, меняется диагностика, вы начинаете на другие графики смотреть, другие методы применять. Со всем этим мы разберемся немного позже. А также вам предстоит познакомиться с методами отбора моделей, потому что для моделей, подобранных методом максимального правдоподобия, немного другие методы отбора работают. [БЕЗ_ЗВУКА]