Более частым случаем использования критерия является сравнение наскольких наборов частот.
Технология расчета здесь похожа. Для исходной таблицы размером n на k с исходными количествами Nij рассчитываются ожидаемые количества Mij, которые были бы, если бы частоты в каждом столбце были бы одинаковыми. После чего вычисляется различие , суммируя их все, получаем общее различие . В том случае, если выполняется нулевая гипотеза об одинаковости распределения исследуемых случайных величин, при числе наблюдений N®¥ распределение величины стремится к распределению с числом степеней свободы (n-1)´(m-1). Практически пользоваться этим критерием можно, как и первоначальным вариантов, если общее число наблюдений не менее 50, а каждое из ожидаемых количеств M1,…, Mk не менее 5-7.
Для этого можно сравнивать группы попарно и рассчитывать достоверность различий в каждой паре. Кроме того, тут решается еще одна техническая проблема.
Однако для таблиц 2 на 2 есть точное решение Фишера, для которого вне зависимости от объема наблюдений достоверность различия рассчитывается правильно[3]. Поэтому есть возможность, переходя к таблицам 2 на 2, получить точное значение р.
Для расчета попарных достоверностей различия частот, относительных рисков и границ к относительным рискам удобно воспользоваться программой, выложенной на проект 1mgmu.com. После загрузки главной страницы нужно перейти по ссылке «Программа определения достоверности различий частот точным тестом Хи-квадрат».
Рассмотрим пример. Пусть среди лиц с инфекционным вирусным гепатитом мы определяем 5-летнюю выживаемость и получили следующие данные:
кол-во
из них умерло
ВГА
ВГВ
ВГС
Рассчитаем общее количество и количество умерших, вычитая количество умерших их общего количества:
кол-во
из них умерло
из них выжило
ВГА
=В2-С2
ВГВ
ВГС
Всего
СУММ(В2:В4)
Получим:
кол-во
из них умерло
из них выжило
ВГА
ВГВ
ВГС
Всего
Рассчитаем летальность
кол-во
из них умерло
из них выжило
летальность
ВГА
=С2/В2
ВГВ
ВГС
Всего
Получим:
кол-во
из них умерло
из них выжило
летальность
ВГА
0,107
ВГВ
0,203
ВГС
0,447
Всего
0,269
Рассчитаем ожидаемое количество умерших, умножив фактическое количество больных на общую летальность (заодно вставив первую строку для подзаголовков):
Ожидаемое количество
кол-во
из них умерло
из них выжило
летальность
умерших
ВГА
0,107
=B3*$E$6
ВГВ
0,203
ВГС
0,447
Всего
0,269
Ожидаемое количество выживших получим, вычитая из общего количества больных ожидаемое количество умерших:
Ожидаемое количество
кол-во
из них умерло
из них выжило
летальность
умерших
выживших
ВГА
0,107
7,522
=В3-F3
ВГВ
0,203
15,851
ВГС
0,447
12,627
Всего
0,269
Рассчитаем различие между ожидаемым и фактическим количеством:
Ожидаемое количество
Различие
кол-во
из них умерло
из них выжило
летальность
умерших
выживших
ВГА
0,107
7,522
20,478
=(C3-F3)*(C3-F3)/F3
ВГВ
0,203
15,851
43,149
ВГС
0,447
12,627
34,373
Всего
0,269
Размножим рассчитанные различия:
Ожидаемое количество
Различие
кол-во
из них умерло
из них выжило
летальность
умерших
выживших
ВГА
0,107
7,522
20,478
2,719
0,999
ВГВ
0,203
15,851
43,149
0,935
0,344
ВГС
0,447
12,627
34,373
5,552
2,040
Всего
0,269
Просуммируем суммарное различие. При этом суммируются все 6 ячеек с различиями:
Ожидаемое количество
Различие
кол-во
из них умерло
из них выжило
летальность
умерших
выживших
ВГА
0,107
7,522
20,478
2,719
0,999
ВГВ
0,203
15,851
43,149
0,935
0,344
ВГС
0,447
12,627
34,373
5,552
2,040
Всего
0,269
Суммарное различие
12,589
Рассчитываем достоверность различий при помощи функции ХИ2РАСП. Так как анализируемая таблица 3 на 2, то число степеней свободы – 2:
Полученное р – около 0,002, то есть высокодостоверно.
Строим график.
При помощи программы расчета доверительной вероятности определяем доверительные границы к летальности. При этом в качестве числа наблюдений надо брать общее число больных, а в качестве «успешных наблюдений» - число летальных исходов. Например, для первой строки с ВГА число наблюдений будет 28, а число успехов – 3.
Ожидаемое количество
Различие
Погрешности
кол-во
из них умерло
из них выжило
летальность
умерших
выживших
-
+
ВГА
0,107
7,522
20,478
2,719
0,999
0,0668072
0,1278919
ВГВ
0,203
15,851
43,149
0,935
0,344
0,0805262
0,1057588
ВГС
0,447
12,627
34,373
5,552
2,040
0,1256932
0,1314067
Всего
0,269
Суммарное различие
12,589
р
0,0018
Добавляем погрешности на график:
Из графика видно, что летальность у больных ВГА и ВГВ достоверно не различается, а у ВГС – выше. Однако желательно пересчитать поточнее, особенно если учесть, что у ВГА ожидаемое число умерших лишь немного больше 5.
Обращаемся к программе «Программа определения достоверности различий частот точным тестом Хи-квадрат» на том же проекте
Для рассмотренного варианта исходные данные надо внести следующим образом:
То есть первая строка – количества выживших, вторая – умерших.
Для нужного варианта расчета нажать кнопку «Посчитать, сравнивая все варианты друг с другом»: