Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Тема 8. статистическая Проверка гипотез

Статистическая гипотеза – это определенное предположение относительно свойств генеральной совокупности, которое можно проверить по данным выборочного наблюдения. Гипотеза, которую необходимо проверить, формулируется как отсутствие различий между параметром генеральной совокупности и заданной величиной.

Эту процедуру проверки гипотез часто применяют для того, чтобы отличить структуру (закономерность) от простой случайности, и с этой точки зрения она дает возможность получить полезные исходные данные для принятия решения. Гипотеза представляет собой утверждение о генеральной совокупности, которое может быть либо верным, либо неверным. Данные помогают решить, какую из двух гипотез принять в качестве истинной.

Нулевая гипотеза, которую обозначают , представляет собой опровергаемое, часто очень конкретное утверждение, как, например, утверждение о чистой случайности.

Исследовательская гипотеза, или альтернативная гипотеза, , является целью доказательства, и для принятия ее в качестве истинной требуется убедительное доказательство против нулевой гипотезы. Принятие нулевой гипотезы представляет собой слабый вывод, а отклонение нулевой гипотезы и принятие альтернативной представляет собой строгое заключение и значимый результат.

Чтобы выяснить, равно ли среднее генеральной совокупности заданному значению , проверяют нулевую гипотезу против альтернативной гипотезы . Заданное значение – это известное фиксированное число , которое получено не из выборочных данных. Такая проверка является двусторонней, поскольку альтернативная гипотеза позволяет, чтобы значение среднего для генеральной совокупности ( ) располагалось как справа, так и слева от заданного значения ( ). Такую проверку гипотезы о среднем генеральной совокупности называют также t-тестом, или t-тестом Стьюдента.

Проверка гипотезы заключается в выяснении того, дальше ли отстоит среднее значение выборки от заданного значения , чем это могло бы быть вызвано случайностью при условии, что равно заданному значению . Таким образом, расстояние между и сравнивают со стандартной ошибкой , используя при этом t-таблицу Стьюдента. Процедуру проверки можно выполнить либо на основе двустороннего доверительного интервала, либо с помощью t-статистики (или t-теста), которая, вычисляется по формуле:

 

(8.1)

 

Ниже описано выполнение двусторонней проверки с использованием доверительного интервала и с использованием t-теста (оба подхода всегда дают один и тот же результат).

Если заданное значение находится в пределах двустороннего доверительного интервала, или (эквивалентное утверждение): , то нулевую гипотезу принимают как приемлемую возможность. Выборочное среднее незначимоотличается от . Наблюдаемая разница между выборочным средним заданным значением может быть обусловлена просто случайностью. Результат не является статистически значимым.

Если заданное значение не находится в пределах двустороннего доверительного интервала, или (эквивалентное утверждение) – , то принимают альтернативную гипотезу и отвергают нулевую гипотезу . Выборочное среднее значимоотличается от . Наблюдаемая разница между выборочным средним и заданным значением не может быть обусловлена только случайностью. Результатявляется статистически значимым.

Выполняя проверку статистической гипотезы, вы, таким образом, принимаете нулевую гипотезу ( ) всякий раз, когда представляет собой приемлемо возможное значение для . Если нулевая гипотеза верна, вероятность того, что будет принято верное решение, равна доверительному уровню (95% или любому другому) того столбца, который вы использовали в t-таблице.

В следующей таблице содержатся основные величины, необходимые для проверки гипотез как о среднем нормально распределенной генеральной совокупности, так и о вероятности наступления события для биномиального распределения (при больших n):

 

Нормальное распределение Биномиальное распределение
Среднее генеральной совокупности
Заданное значение
Нулевая гипотеза
Альтернативная гипотеза
Данные x событий из n испытаний (доля)
Оценка
Стандартная ошибка
Доверительный интервал
t-статистика (или t-тест)

 

t-статистики (или t-теста) представляет собой пример более общего понятия тест-статистики, наиболее полезной с точки зрения выбора одной из двух гипотез, величины, которую вычисляют на основе имеющихся данных. Значение тест-статистики сравнивают с соответствующим критическим значением, которое находят по стандартной статистической таблице. Например, t-значение из t-таблицы является критическим t-значением. Полезное эмпирическое правило заключается в том, что если абсолютное значение t-статистики (или t-теста) больше числа 2, то нулевую гипотезу отклоняют, в противном случае – принимают.

Односторонний t-тест соответствует нулевой гипотезе, утверждающей, что значение находится по одну сторону от , и альтернативной гипотезе, утверждающей, что значение находится по другую сторону от . Чтобы использовать односторонний (направленный) тест, следует быть уверенным, что независимо от поведения данных, вы будете продолжать использовать односторонний тест на той же стороне («больше, чем» или «меньше, чем»). Если существуют сомнения, следует использовать двусторонний тест; если результат двустороннего теста окажется значимым, затем на его основе можно сделать односторонний вывод.

Проверку гипотезы можно выполнить путем построения ответствующего одностороннего доверительного интервала (в соответствии с утверждением альтернативной гипотезы) или с помощью t-статистика (или t-тест). Значимыйрезультат (принятие альтернативной гипотезы) будет иметь место, когда значение заданной величины не попадет в доверительный интервал. Это происходит в том случае, когда находится на предполагаемой альтернативной гипотезой стороне от и значение t-статистики по абсолютной величине больше табличного t-значения. Результат является значимым, если (когда проверяется ) или (когда проверяется ).

Для одностороннего t-теста, проверяющего, больше ли , чем ,гипотезу формулируют так: и . Доверительный интервал включает все значения, которые, по крайней мере, не меньше, чем .

Если заданное значение находится внутри доверительного интервала, или (эквивалентное утверждение): , то нулевую гипотезу принимают как приемлемую возможность. Выборочное среднее незначимо больше . Если больше , наблюдаемую разность можно объяснить только случайностью. Результат не является статистически значимым.

Если не находится внутри доверительного интервала, или (эквивалентное утверждение): , то принимают альтернативную гипотезу и отвергают нулевую гипотезу . Выборочное среднее значимо больше . Наблюдаемую разность между выборочным средним и заданным значением не может быть обусловлена только случайностью. Результатявляется статистически значимым.

Для одностороннего t-теста, проверяющего, меньше ли , чем ,гипотезу формулируются так: и . Доверительный интервал включает все значения, которые не больше, чем .

Если находится внутри доверительного интервала, или (эквивалентное утверждение): , то нулевую гипотезу принимают как приемлемую возможность. Выборочное среднее незначимо меньше . Если меньше, чем , наблюдаемую разность можно объяснить только случайностью. Результат не является статистически значимым.

Если не находится внутри доверительного интервала, или (эквивалентное утверждение): , то принимают альтернативную гипотезу и отвергают нулевую гипотезу . Среднее выборки значимо меньше . Наблюдаемую разность нельзя объяснить лишь случайностью. Результатявляется статистически значимым.

В зависимости от того, какая из гипотез в действительности является истинной, можно совершить два типа ошибок. Ошибку I рода допускают, отвергая верную нулевую гипотезу и объявляя результат проверки статистически значимым. Вероятность совершения ошибки I рода (при верной нулевой гипотезе) определяется выбором соответствующего значения в t- таблице, обычно это уровень значимости 0,05 (5%).

Ошибку II рода совершают, принимая нулевую гипотезу, и объявляя результат статистически незначимым, в то время как истинной является альтернативная гипотеза. Вероятностью совершения ошибки II рода (при верной альтернативной гипотезе) управлять нелегко, но она может находиться (в зависимости от истинного значения ) в пределах от 0до уровня доверия, теста (например, 95%). Обратите внимание, что каждый тип ошибки основан на предположении об истинности одной из гипотез. Поскольку каждая из гипотез либо верна, либо неверна, в зависимости от генеральной совокупности (но не отданных), мы не рассматриваем понятие вероятности справедливости гипотезы.

Предварительные условия, необходимее для проверки гипотезы, следующие: (1)набор данных является случайной выборкой из рассматриваемой генеральной совокупности, (2) либо измеряемые величины являются приблизительно нормально распределенными, либо размер выборки достаточно велик для того, что бы среднее значение выборки было приблизительно нормально распределено.

Уровень проверки, или уровень значимости, представляет собой вероятность принять альтернативную гипотезу, когда правильной является нулевая гипотеза (т.е. совершить ошибку I рода). Обычно этот уровень устанавливают равным 5%, но его можно установить равным 1% или 0,1% (или даже 10% для некоторых задач), выбрав соответствующий столбец t-таблицы.

p-значение показывает, насколько необычным является получение имеющихся данных при условии справедливости нулевой гипотезы. Малые p-значение свидетельствуют о малой вероятности такого события и приводят к отклонению . Обычно отвергают, когда p-значение меньше 0,05. Результат проверки называют статистически значимым (р < 0,05), если он значим на уровне 5%. Используют также термины высоко значимый (р < 0,01), очень высоко значимый (р < 0,001) и незначимый (p > 0,05).

 




©2015 studopedya.ru Все права принадлежат авторам размещенных материалов.