В этом видео мы поговорим о том, как тестировать статистическую значимость коэффициентов корреляции. По сути дела мы лишь повторим то, что нам известно из предыдущего курса, так как логика этого анализа полностью совпадает с логикой тестирования любой другой статистической гипотезы. Коэффициент корреляции, это статистика, описывающая степень взаимосвязи двух сопряженных переменных. Следовательно здесь применима логика статистического критерия. Как и в случае, например, t-критерия, о котором мы подробно говорили в предыдущем курсе, для коэффициента корреляции есть нулевая гипотеза, а именно, что в генеральной совокупности связь отсутствует, то есть корреляция равна нулю. Обратите внимание, в данном случае мы воспользовались обозначением ро, которое соответствует, эта греческая буква соответствует связи в генеральной совокупности. Важно, что альтернативная гипотеза должна быть сформулирована до начала тестирования, поскольку здесь могут быть как двусторонние так и односторонние альтернативные гипотезы. Как вы помните, тестирование этих двух типов гипотез зависит от того, какую альтернативу мы рассматриваем. Разными будут при этом пороги отвержения нулевой гипотезы, и собственно, при одном и том же уровне альфа мы будем отвергать нулевую гипотезу при одном и том же, при разных значениях. Соответственно, двусторонняя альтернативная гипотеза будет говорить о том, что связь существует, то есть ро не равно нулю, то есть связь есть, неважно какая, положительная - отрицательная, но связь есть. Одностороннее же гипотеза подразумевает, что мы утверждаем, что корреляция строго положительная или строго отрицательная, и именно это мы должны проверить нашим тестом. То есть мы должны заранее утверждать какой тип связи мы считаем присутствует в генеральной совокупности. Почему это важно? Это важно потому что односторонние тесты более мягкие, и мы можем прийти к выводу что связь есть там где ее нет. То есть мы можем совершить статистическую ошибку и найти корреляцию там, где ее нет. Здесь важно не жульничать, и как ни парадоксально, не подгонять теорию под результат. Абсолютно аналогично t-критерию, если нулевая гипотеза не может быть отвергнута, то никаких суждений о существовании взаимосвязи мы вынести не можем. Если мы отвергаем нулевую гипотезу при определенном значении альфа, то мы сохраняем альтернативную гипотезу. Собственно, вот такова логика тестирования этой гипотезы. Поскольку вычисленный коэффициент корреляции, это лишь выборочная оценка некоторого генерального коэффициента, то для этой оценки необходимо вычислить уже знакомую нам величину, это стандартная ошибка. Стандартная ошибка коэффициента корреляции Пирсона вычисляется вот по такой формуле. Как и в случае с t-критерием, нам понадобится стандартизовать. Стандартизированная величина t, которая будет равна отношению самого коэффициента корреляции к его стандартной ошибке, и далее, эта величина, она тоже подчиняется тому же t-распределению как и в случае с разностью средних значений, и единственный параметр t-распределение, который называется числом степеней свободы, в данном случае будет равен n-2. Далее, точно так же надо сравнить полученные значение t с пороговым значением, если модуль этой величины превышает пороговое значение, то можно утверждать, что корреляция статистически значима.