Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Определение достоверности отличия нескольких наборов частот



Более частым случаем использования критерия является сравнение наскольких наборов частот.

Технология расчета здесь похожа. Для исходной таблицы размером n на k с исходными количествами Nij рассчитываются ожидаемые количества Mij, которые были бы, если бы частоты в каждом столбце были бы одинаковыми. После чего вычисляется различие , суммируя их все, получаем общее различие . В том случае, если выполняется нулевая гипотеза об одинаковости распределения исследуемых случайных величин, при числе наблюдений N®¥ распределение величины стремится к распределению с числом степеней свободы (n-1)´(m-1). Практически пользоваться этим критерием можно, как и первоначальным вариантов, если общее число наблюдений не менее 50, а каждое из ожидаемых количеств M1,…, Mk не менее 5-7.

 

Для этого можно сравнивать группы попарно и рассчитывать достоверность различий в каждой паре. Кроме того, тут решается еще одна техническая проблема.

Однако для таблиц 2 на 2 есть точное решение Фишера, для которого вне зависимости от объема наблюдений достоверность различия рассчитывается правильно[3]. Поэтому есть возможность, переходя к таблицам 2 на 2, получить точное значение р.

Для расчета попарных достоверностей различия частот, относительных рисков и границ к относительным рискам удобно воспользоваться программой, выложенной на проект 1mgmu.com. После загрузки главной страницы нужно перейти по ссылке «Программа определения достоверности различий частот точным тестом Хи-квадрат».

Рассмотрим пример. Пусть среди лиц с инфекционным вирусным гепатитом мы определяем 5-летнюю выживаемость и получили следующие данные:

  кол-во из них умерло
ВГА
ВГВ
ВГС

Рассчитаем общее количество и количество умерших, вычитая количество умерших их общего количества:

 

  кол-во из них умерло из них выжило
ВГА =В2-С2
ВГВ  
ВГС  
Всего СУММ(В2:В4)    

 

Получим:

  кол-во из них умерло из них выжило
ВГА
ВГВ
ВГС
Всего

Рассчитаем летальность

  кол-во из них умерло из них выжило летальность
ВГА =С2/В2
ВГВ  
ВГС  
Всего  

Получим:

  кол-во из них умерло из них выжило летальность
ВГА 0,107
ВГВ 0,203
ВГС 0,447
Всего 0,269

 

Рассчитаем ожидаемое количество умерших, умножив фактическое количество больных на общую летальность (заодно вставив первую строку для подзаголовков):

          Ожидаемое количество
  кол-во из них умерло из них выжило летальность умерших
ВГА 0,107 =B3*$E$6
ВГВ 0,203  
ВГС 0,447  
Всего 0,269  

 

Ожидаемое количество выживших получим, вычитая из общего количества больных ожидаемое количество умерших:

          Ожидаемое количество  
  кол-во из них умерло из них выжило летальность умерших выживших
ВГА 0,107 7,522 =В3-F3
ВГВ 0,203 15,851  
ВГС 0,447 12,627  
Всего 0,269    

 

Рассчитаем различие между ожидаемым и фактическим количеством:

          Ожидаемое количество   Различие
  кол-во из них умерло из них выжило летальность умерших выживших  
ВГА 0,107 7,522 20,478 =(C3-F3)*(C3-F3)/F3
ВГВ 0,203 15,851 43,149  
ВГС 0,447 12,627 34,373  
Всего 0,269      

 

Размножим рассчитанные различия:

          Ожидаемое количество   Различие  
  кол-во из них умерло из них выжило летальность умерших выживших    
ВГА 0,107 7,522 20,478 2,719 0,999
ВГВ 0,203 15,851 43,149 0,935 0,344
ВГС 0,447 12,627 34,373 5,552 2,040
Всего 0,269        

 

Просуммируем суммарное различие. При этом суммируются все 6 ячеек с различиями:

          Ожидаемое количество   Различие  
  кол-во из них умерло из них выжило летальность умерших выживших    
ВГА 0,107 7,522 20,478 2,719 0,999
ВГВ 0,203 15,851 43,149 0,935 0,344
ВГС 0,447 12,627 34,373 5,552 2,040
Всего 0,269        
Суммарное различие                
12,589                

 

Рассчитываем достоверность различий при помощи функции ХИ2РАСП. Так как анализируемая таблица 3 на 2, то число степеней свободы – 2:

 

 

Полученное р – около 0,002, то есть высокодостоверно.

Строим график.

При помощи программы расчета доверительной вероятности определяем доверительные границы к летальности. При этом в качестве числа наблюдений надо брать общее число больных, а в качестве «успешных наблюдений» - число летальных исходов. Например, для первой строки с ВГА число наблюдений будет 28, а число успехов – 3.

          Ожидаемое количество Различие Погрешности
  кол-во из них умерло из них выжило летальность умерших выживших     - +
ВГА 0,107 7,522 20,478 2,719 0,999 0,0668072 0,1278919
ВГВ 0,203 15,851 43,149 0,935 0,344 0,0805262 0,1057588
ВГС 0,447 12,627 34,373 5,552 2,040 0,1256932 0,1314067
Всего 0,269            
Суммарное различие                    
12,589                    
р 0,0018                  

Добавляем погрешности на график:

Из графика видно, что летальность у больных ВГА и ВГВ достоверно не различается, а у ВГС – выше. Однако желательно пересчитать поточнее, особенно если учесть, что у ВГА ожидаемое число умерших лишь немного больше 5.

Обращаемся к программе «Программа определения достоверности различий частот точным тестом Хи-квадрат» на том же проекте

Для рассмотренного варианта исходные данные надо внести следующим образом:

 

То есть первая строка – количества выживших, вторая – умерших.

Для нужного варианта расчета нажать кнопку «Посчитать, сравнивая все варианты друг с другом»:

В результате получаем:




©2015 studopedya.ru Все права принадлежат авторам размещенных материалов.