так как одна и только одна из пар обязательно даёт одну инверсию, а число пар равно
3.
Основа статистики
1) Если гипотеза верна (законы распределения ГСI и ГСII совпадают), то для любых i, j
, (*)
поэтому, в среднем, Таким образом, при верной
2) Возьмём для простоты m = n. При верной , так как репрезентативные выборки достаточно хорошо отражают свойства генеральных совокупностей, общий вариационный ряд сделанных выборок имеет вид
При неверной (*) нарушается, например и тогда в общем вариационном ряду большая часть элементов расположится в левой половине вариационного ряда, из-за чего станет значительно меньше, чем При самой большой неоднородности распределений ГС I и ГС II общий вариационный ряд имеет вид
Следовательно, статистика критерия оценивает близость распределений ГСI и ГСII по близости её выборочного значения к mn/2.
3. По данному УЗ α при использовании двустороннего критерия Манна-Уитни по таблицам его критических значений находят левое и правое критические значения. Допустимая для принятия m и n область имеет вид
4. По выборкам находят выборочное значение статистики критерия. Если , то принимается и вероятность ошибки в принятии в точности равна α . В противном случае отклоняется.
Замечания
1. Часто в таблицах приводится только левое или правое критическое значение. Тогда недостающее критическое значение находят из равенства .
2. При больших m и n (≥ 50) критические значения статистики критерия приближённо находятся по таблицам квантилей стандартного нормального распределения. Известно, что при больших m и n
Поэтому, если - квантиль стандартного нормального распределения, то отклоняется.
3. Важно. Если в выборках имеется l совпадений, то статистику критерия считают по поправочной формуле
Если число совпадений превышает число инверсий, то пользоваться критерием Манна-Уитни не рекомендуется.
Окончание примера 1.
Возьмём α = 0,05, тогда α/2 = 0,025.
По таблицам (0,025; 6; 7) = 6, тогда (0,025; 6; 7) =36. Так как ,
принимается.
Лучше применить левосторонний критерий, так как = 8 ближе к 0 (к левому краю), чем к 21 (к середине). По таблицам (0,05; 6; 7) = 8, , поэтому принимается.
Общее правило. Если выборочное значение статистики критерия близко к середине (mn/2), то применяют двусторонний критерий, а если к краю (к 0 или к mn) – то соответствующий односторонний критерий.
Ранжирование выборки
Рассматривается ГС со случайным признаком Х , измеренным в порядковой шкале. Вариационный ряд выборки объёма n из этой ГС в идеальном случае имеет вид (например, в случае непрерывной случайной величины Х , когда вероятность совпадения двух значений в выборке равна 0). Но на практике в выборке могут быть одинаковые значения, тогда вариационный ряд имеет вид .
Ранжированные выборки - это приписывание каждому члену вариационного ряда его порядкового номера – ранга в вариационном ряду выборки.
Пример 1. Выборка 2, 5, 19, 8, 1, 4.
Вариационный ряд 1, 2 4, 5, 8, 19.
Ранги членов 1, 2, 3, 4, 5, 6.
Сложности в ранжировании возникают, когда среди элементов выборки встречаются совпадения, Тогда используют средние ранги , которые могут быть дробными.
Пример 2.
Вариационный ряд 1 1 2 2 2 4 5 19,
Ранги членов 1,5 1,5 4 4 4 6 7 8,
так как 1,5 = (1 + 2) / 2 , 4 = (3 + 4 + 5) / 3.
При большом числе совпадающих значений в выборке следует либо повысить точность измерения признака Х , либо перейти к номинативной шкале.
Проверка гипотезы об однородности двух ГС по критерию Уилкоксона (по критерию суммы рангов)
Этот критерий эквивалентен критерию Манна-Уитни.
Постановка задачи – как в критерии Манна-Уитни.
Проверка гипотезы по критерию Уилкоксона
1. Предварительная обработка выборок.
Записывается вариационный ряд для выборок из ГС I и ГС II. Затем общий вариационный ряд ранжируется.