Для расчета достоверности различий средних по подгруппам достаточно при выполнении команды Analyze / Compare Means / Means, нажав на кнопку Options, отметить ANOVA Table and eta. Переменная у которой рассчитывается среднее арифметическое нужно определить, как зависимую, а переменную , по значению которой определяются подгруппы, как независимую. Например, рассчитаем средние значения возраста (age of patient) для мужчин и женщин (sex of patient):
Получаем таблицу:
Report
age of patient
sex of patient
Mean
N
Std. Deviation
male
52,29
17,606
female
58,11
19,509
Total
54,53
18,572
Средний возраст мужчин примерно на 6 лет меньше, чем женщин.
В следующей таблице последняя колонка показывает достоверность различий. В результате получаем, что различия достоверны с p<0,001.
ANOVA Table
Sum of Squares
df
Mean Square
F
Sig.
age of patient * sex of patient
Between Groups
(Combined)
8283,009
8283,009
24,564
,000
Within Groups
347315,735
337,200
Total
355598,744
Аналогично при определении достоверности отличия среднего от ожидаемого значения достаточно выполнить команду Analyze / Compare Means / One Sample T-test, выбрать переменную и в окошке Test Value задать ожидаемое значение. Например, рассчитаем среднее значение пульса и сравним его с ожидаемым значением – 90.
В первой таблице, мы получаем среднее значение пульса пациентов равное 97,14 рассчитанное для группы из 1032 пациентов. Среднеквадратичное отклонение равно 13,884 и среднеквадратичное отклонение среднего по группе возраста составило 0,432.
One-Sample Statistics
N
Mean
Std. Deviation
Std. Error Mean
pulse of the patient in minuite
97,14
13,884
,432
Вторая таблица показывает результат сравнения полученного среднего арифметического с ожидаемым значением пульса 90.
One-Sample Test
Test Value = 90
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
pulse of the patient in minuite
16,524
,000
7,14
6,29
7,99
One-Sample Test
Test Value = 50
t
df
Sig. (2-tailed)
Mean Difference
95% Confidence Interval of the Difference
Lower
Upper
age of patient
7,844
,000
4,53
3,40
5,67
«Means Difference»(разность между средними) показывает, что фактическое значение оказалось ожидаемого на 7,14. Величина t показывает во сколько раз эта разность больше среднеквадратичного отклонения среднего по группе, что в данном случае дало 16,524. Двухсторонняя доверительная вероятность совпадения «Sig.(2-tailed)» оказывается меньше 0,001 (в таблице 0,000 т.к. большее количество знаков не вмещается). Таким образом, можно сказать, что различия достоверны с вероятностью p < 0,001.
Однако бывают случаи, когда подобные расчеты надо проводить «руками». Поэтому вновь решим три типовые задачи.
Типовые задачи.
А. Определение достоверности отличия математического ожидания от ожидаемого значения.
Пусть имеются следующие данные:
Полученное среднее арифметическое
47,3
Полученная оценка среднеквадратичного отклонения
14,9
Число наблюдений N
Ожидаемое математическое ожидание
Из линейных свойств параметров следует, что среднеквадратичное отклонение среднего из N наблюдений в корень из N раз меньше, чем у одного наблюдения.
Полученное среднее арифметическое
47,3
Полученная оценка среднеквадратичного отклонения
14,9
Число наблюдений N
Ожидаемое математическое ожидание
Среднеквадратичное отклонение среднего по группе
=В2/корень(В3)
Далее величина t рассчитывается как разность полученного и ожидаемого значения среднего, деленное на оценку среднеквадратичного отклонения среднего по группе:
Полученное среднее арифметическое
47,3
Полученная оценка среднеквадратичного отклонения
14,9
Число наблюдений N
Ожидаемое математическое ожидание
Среднеквадратичное отклонение среднего по группе
2,00911559
t
=(В1-В4)/В5
Различие между двумя средними устанавливается с помощью критерия, который использует распределение Стьюдента с числом степеней свободы равным N-1 (критерий Стъюдента).
Для проверки гипотезы и расчета р можно воспользоваться затабулированной а Excel функции СТЬЮДРАСП. При этом, так как мы проверяем гипотезу о равенстве, а не о том, что что-то больше или меньше, то доверительные границы надо брать двусторонними, то есть указывать «число хвостов» равным двум, а в качестве исходного значения подставлять модуль t. Проще всего его вычислить при помощи встроенной функции abs.
Полученное среднее арифметическое
47,3
Полученная оценка среднеквадратичного отклонения
14,9
Число наблюдений N
Ожидаемое математическое ожидание
Среднеквадратичное отклонение среднего по группе
2,00911559
t
-1,343874894
р
0,184608355
В результате получили p=0,1846 - различия недостоверны.
Для данных, имеющихся в SPSS , подобную проверку можно делать при помощи команды Analize / Compare Means / One Sample T-test, после чего выбрать нужную переменную, а в качестве Test value задать ожидаемое значение.
Например, проверим, действительно ли средний возраст больных пневмонией отличается от 50 лет:
В результате получили:
Полученная величина среднего возраста 54,53 года, что на 4,53 больше ожидаемого значения. Среднеквадратичное отклонение среднего по группе составило 0,58 года, так что t, равное отношению разности к этому отклонению, было равно 7,844. Число степеней свободы – на единицу меньше числа наблюдений. В результате получили, что различия достоверны с p<0,001.
Также рассчитаны и 95%-ные доверительные границы для разности фактического и ожидаемого значения. Так как они – от 3,44 до 5,67, то при ожидаемом значении в 50 получаем, что 95%-ные доверительные границы для среднего возраста – от 53,4 до 55,67.