Итак, мы ввели понятие логита, который обладает достаточно приятными для нас свойствами. Он распределен от минус бесконечности до плюс бесконечности, но у нее есть еще одно важное свойство. Дело в том, что после логит-преобразования, логистическая кривая становится прямой. Давайте посмотрим, как будет вести себя связь между вероятностью события и предиктором, если вероятность будем отражать в виде логитов. Здесь придется немножко вспомнить алгебру. И, собственно, используя алгебру, давайте докажем, что логит-преобразование приведет к тому, что логистическая кривая превратится в прямую. Если предиктор у нас только один, тогда логистическая модель примет такую форму: зависимая переменная "π" будет связана с предиктором таким образом. И, давайте для краткости, обозначим эту часть логистической кривой модели буквой "z". Это просто буква, которой мы обозначили, чтобы меньше писать всех преобразований, всех значений. Давайте докажем, что логит-преобразование, то есть, логит от "π", который, мы уже знаем, что выражается таким образом - это натуральный логарифм от отношений вероятности события к вероятности того, что событие не произойдет. Давайте посмотрим, попытаемся доказать, что этой самый логит будут равны "z", то есть равны просто линейной функции. Для этого давайте немножко поработаем и вспомним алгебру. Подставим выражение для "π" в формулу логита. Мы это сделали. И, поскольку, мы помним, что "π" записывается в виде логистической функции вот таким образом, то мы произведем такую замену, но мы помним из алгебры, что логарифм отношения равен разности логарифмов и тогда эту трехэтажную формулу мы можем преобразовать в такую более простую форму, соответственно, числитель будет здесь, а это будет знаменатель. Эту вторую дробь, которая пока тоже достаточно сложно устроена, можно упростить. Соответственно, если мы произведем необходимые преобразования, то тогда все будет записано следующим образом. Поскольку, мы произведем умножение знаменателя на единицу, получится такая запись, в которой у нас уходят подобные члены и в итоге, предыдущая сложная формула преобразуется в очень простую формулу, которую мы еще сможем немножко преобразовать. Посмотрим, что будет дальше. Продолжим преобразование. Соответственно, эта формула тоже содержит логарифм отношений, который мы можем преобразовать в разницу, разность алгоритмов. Они, соответственно, получились. И далее, если мы раскроем скобки, то получится все достаточно просто. Смотрите, этот логарифм единица становится нулем, после раскрытия скобок этот знак поменялся и в итоге у нас появились подобные члены, которые мы можем тоже сократить. В итоге смотрите, что получается. Получается, что у нас остается всего лишь небольшая величина, которая записывается, как натуральный логарифм от "е" в степени "z", но это и будет "z", вернемся к исходной нотации. И мы видим, что эта логистическая кривая в формате логитов, превращается в обычную прямую. Это для нас становится самым важным, поскольку, далее мы можем использовать уже имеющийся у нас арсенал подбора параметров такой модели. Эта функция, таким образом, логит-преобразование, становится уже известной нам связывающей функцией, которую мы уже применяли для связей между предиктором и зависимой переменной. Логит, как связующая функция, на самом деле, не единственное решение. При анализе бинарных данных применяют и некоторые другие связывающие функции, например, probit, связывающий функцию или cloc loc, связывающий функцию и такие преобразования можно применять и помимо логит-преобразований, но это уже следующая часть анализа, мы сейчас ее не будем касаться. Давайте еще раз повторим всю математическую логику тех преобразований, которые у нас были. Они не очень органолитичные, их надо просто прочувствовать. Итак, во-первых, от дискретной оценки событий (1 или 0), мы переходим к оценке вероятностей, то есть получаем уже непрерывную величину. Во-вторых, связь вероятностей с предиктором мы уже будем описывать не прямой какой-то, а кривой, которая называется логистическая кривая. Третья особенность: если, при помощи функции связи, то есть логит преобразования, перейти от вероятности к логитам, то есть связь с предиктором будет описываться прямой линией. Четвертая особенность. Параметры этой линейной модели, которая будет описывать связь между вероятностью событий, но в терминах логитов, можно оценить при помощи обычной линейной модели. И теперь мы готовы сформулировать модель уже в математическом виде. Она будет записана следующим образом, то есть, собственно, то, что мы будем дальше подбирать. Зависимая переменная - это будет вероятность, которая подчиняется биномиальному распределению и связь между мат ожиданием, то есть, вероятностью и предиктором будет описываться вот такой логистической кривой. Мы ее написали несколько сложнее, поскольку у нас предикторов может быть много. После применения функции связи, которая в нашем случае, мы будем использовать логит-преобразование, мы уже будем работать не с обычными вероятностями, а с их иной реинкарнацией, иной ипостасью - это логиты. И, соответственно, если мы эту величину, которая будет у нас моделироваться, мы ее обозначим как "это". Запишем, уже в окончательном виде окажется, что это всего лишь прямая, какая-то линейная комбинация предикторов, которую мы можем далее и использовать и подвергаться моделированию. Соответственно, если мы хотим построив модель, перейти обратно от логитов к вероятностям, то применяется так называемое логистическое преобразование. Это, собственно, обратная функция к логит-преобразованию, она будет выглядеть так. Мы далее столкнемся с тем, что мы эту функцию будем применять. И после таких нехитрых преобразований, мы можем приступать к построению модели и подбору параметров этой самой линейной функции.