Одной из наиболее часто встречающихся задач, связанных с исследованием статистических совокупностей, является проверка предположений о законах распределения изучаемого признака, об однородности выборок, о значениях параметров генеральной совокупности и т. д.
Процедура сопоставления предположений с результатами наблюдений получила название статистической проверки гипотез.
Пусть имеется выборка x1,x2,...,xn из генеральной совокупности, распределение которой характеризуется некоторым параметром. И пусть относительно этого параметра высказывается некоторое предположение. Назовем его нулевой гипотезой и обозначим Н0. Предположение, противоречащее гипотезе H0, называют альтернативной (конкурирующей) гипотезой и обозначают H1.
Ввиду того, что выборка всегда несет в себе элемент случайности, статистически подтвержденную гипотезу следует расценивать не как абсолютно верный факт, а лишь как достаточно правдоподобное утверждение, не противоречащее данному опыту. Может оказаться, что некоторая выборка заставит нас отвергнуть заведомо верную гипотезу, или наоборот. Такие ошибки называются ошибками I и II рода.
Проверка нулевой гипотезы осуществляется с помощью количественного критерия - функции результатов наблюдений . Будучи случайной величиной, подчинена одному из законов, зависящих только от объема выборки n (в предположении справедливости гипотезы H0). Основными из них являются известные законы: c2 - распределение, t - распределение Стъюдента и F - распределение Фишера.
Все множество возможных значений случайной величины q можно разбить на два непересекающихся подмножества - область допустимых значений критерия и W – критическую область. Вероятность попадания критерия в область W обозначается и называется уровнем значимости, а вероятность попадания в область - уровнем достоверности (надежности).
Решающим правилом для принятия нулевой гипотезы является попадание эмпирического значения критерия эмп в область допустимых значений . Если эмп оказалось в критической области W, гипотеза отвергается.
Критическими точками (границами) называются границы областей и W. Правосторонней называется критическая область, определяемая неравенством ; левосторонней называется критическая область, определяемая неравенством . Двусторонней называется критическая область, определяемая неравенствами где В частности, если критические точки симметричны относительно нуля, то двусторонняя критическая область определяется неравенством
При заданном уровне значимости b критические области определяются из равенств:
а) правосторонняя –
б) левосторонняя –
в) двусторонняя симметричная –
Гипотеза называется параметрической, если необходимо проверить предположение о значениях параметров известного распределения.