Статистической гипотезой Н называется предположение относительно параметров или вида распределения случайной величины Х.
Статистическая гипотеза Н называется простой, если она однозначно определяет распределение случайной величины Х; в противном случае, гипотеза Н называется сложной.
Проверяемая гипотеза называется нулевой гипотезой и обозначается Но. Это гипотеза об отсутствии различий, называется нулевой потому, что содержит число 0: X1- Х2=0, где X1, X2 - сопоставляемые значения признаков.
Альтернативная гипотеза - это гипотеза о значимости различий. Она обозначается как H1. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной гипотезой.
Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы: H0: X1 не превышает Х2, H1: X1 превышает Х2,
Ненаправленные гипотезы: H0: X1 не отличается от Х2 Н1: Х1 отличается от Х2
Правило, по которому принимается решение принять или отклонить нулевую гипотезу, называется критерием.
Статистический критерий - это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью.
В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.
Мощность критерия - это его способность выявлять различия, если они есть, тое есть это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.
Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода. Вероятность такой ошибки обозначается как β. Мощность критерия - это его способность не допустить ошибку II рода, поэтому мощность равна 1 — β. Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для выбора критерия может быть не только мощность, но и другие его характеристики, а именно: а) простота;
б) более широкий диапазон использования; в) применимость по отношению к неравным по объему выборкам; г) большая информативность результатов.
Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05. Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.
Уровень статистической значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.
Ошибка, состоящая в том, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой I рода. Вероятность такой ошибки обозначается как α. Если вероятность ошибки - это α, то вероятность правильного решения: 1 - α. Чем меньше α, тем больше вероятность правильного решения.
Правило отклонения H0 и принятия H1:
Если эмпирическое значение критерия равняется критическому значению, соответствующему р<0,05 или превышает его, то H0 отклоняется, но мы еще не можем определенно принять H1. Если эмпирическое значение критерия равняется критическому значению, соответствующему р<0,01 или превышает его, то H0 отклоняется и принимается H1.
Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна Уитни. Для них устанавливаются обратные соотношения.
Таким образом, формулирование гипотез систематизирует предположения исследователя и представляет их в четком и сжатом виде. Благодаря гипотезам исследователь не теряет ориентира в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил. Проверка статистической гипотезы основывается на принципе, в соответствии с которым маловероятные события считаются невозможными, а события, имеющие большую вероятность, - достоверными.
Проверка гипотез осуществляется с помощью критериев статистической оценки различий. При описании каждого критерия в руководстве даны формулировки гипотез, которые он помогает нам проверить.
Регрессио́нный (линейный) анализ — статистический метод исследования зависимости между зависимой переменной Y и одной или несколькими независимыми переменными X1,X2,...,Xp. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных), а не причинно-следственные отношения.
Цель регрессионного анализа: 1.Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)2.Предсказание значения зависимой переменной с помощью независимой(-ых)3. Определение вклада отдельных независимых переменных в вариацию зависимой.
Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа.