Для расчета среднего арифметического, дисперсии и ряда других параметров в SPSS есть несколько возможностей:
1. Выполнить команду Analyze / Descriptive Statistics / Descriptives, выбрать переменные, нажать кнопку Options и выбрать нужные параметры.
2. Выполнить команду Analyze / Descriptive Statistics / Frequencies, выбрать переменные, нажать кнопку Statistics и выбрать нужные параметры.
3. Если надо рассчитать параметры по подгруппам, можно выполнить команду Analyze / Compare Means / Means , переменные, для которых рассчитываются параметры, выбрать в Dependent List, переменную, по значениям которой выделяются подгруппы, выбрать в Independent List, нажать кнопку Options и выбрать параметры, которые требуется рассчитать. Для примера, используя файл Jasvasi.sav рассчитаем средние значения непрерывной переменной vozrast для каждого значения дискретной переменной Rezidive
В результате получаем две таблицы. В первой таблице определено количество обработанных пар (Included) и необработанных (Excluded), если такие есть.
Во второй таблице Report для каждого значения дискретной переменной Rezidive определены значения переменной Vozrast: средние (Means), количество пациентов с рецидивом и без (N), среднеквадратичное отклонение переменной Vozrast для каждого значения переменной Rezidive (Std. Deviation), а также минимальное, максимальное, первое, последнее значения и дисперсию.
Cases
Included
Excluded
Total
N
Percent
N
Percent
N
Percent
VOZRAST * REZIDIVE
100,0%
,0%
100,0%
Report
VOZRAST
REZIDIVE
Mean
N
Std. Deviation
Minimum
Maximum
First
Last
Variance
46,43
13,769
189,581
53,63
17,071
291,421
Total
48,82
15,311
234,420
SPSS в стандартной конфигурации не определяет достоверность различия дисперсий, поэтому даже в том случае, если данные введены в SPSS, это надо делать самому. Впрочем, та же проблема была и при определении доверительных границ к процентилям.
Для оценки соответствия или расхождения полученных эмпирических данных и теоретических (расчетных, прогнозных) распределений наибольшее распространение получил непараметрический критерий К. Пирсона – χ2 (хи-квадрат). Его можно использовать с различными формами распределения совокупностей. Он не доказывает справедливость нулевой гипотезы, а лишь устанавливает с определенной вероятностью ее согласие или несогласие с экспериментальными данными. Критерий применяется при условии наличия не менее 5 наблюдений в каждой группе, классе или совокупности.
Пусть дисперсия случайной величины Х известна и равна D. Тогда оценка выборочной дисперсии по N измерениям будет подчиняться χ2-распределению с N-1 степенью свободы, а точнее будет распределена как величина . Как мы помним, χ2-распределение в Excel затабулировано, что позволяет рассчитывать достоверности различий. Решим несколько типовых задач.
Типовые задачи.
А. Определение достоверности отличия дисперсии от ожидаемого значения.
Пусть имеются следующие данные:
Полученная оценка среднеквадратичного отклонения
15,9
Ожидаемая величина среднеквадратичного отклонения
Число наблюдений N
Определим достоверность отличия полученной величины от ожидаемой.
Рассчитаем дисперсии как квадраты среднеквадратичного отклонения:
Полученная оценка среднеквадратичного отклонения
15,9
Ожидаемая величина среднеквадратичного отклонения
Число наблюдений N
Полученная оценка дисперсии
=В1*В1
Ожидаемая дисперсия
=В2*В2
Рассчитаем отношение оценки дисперсии к ее ожидаемому значению:
Полученная оценка среднеквадратичного отклонения
15,9
Ожидаемая величина среднеквадратичного отклонения
Число наблюдений N
Полученная оценка дисперсии
252,81
Ожидаемая дисперсия
Отношение оценки и ожидаемого значения
=В4/В5
При истинности проверяемого предположения полученная величина должна быть распределена как . Умножив отношение на N-1, получим величину, которая должна быть распределена как хи-квадрат:
Полученная оценка среднеквадратичного отклонения
15,9
Ожидаемая величина среднеквадратичного отклонения
Число наблюдений N
Полученная оценка дисперсии
252,81
Ожидаемая дисперсия
Отношение оценки и ожидаемого значения
1,755625
Полученная величина хи-квадрат
=В6*(В3-1)
Рассчитаем вероятность того, что хи-квадрат распределение с данным числом степеней свободы (которое на 1 меньше числа наблюдений) принимает такие или меньшие значения:
Так как мы проверяем гипотезу не о том, что дисперсия меньше ожидаемой, а о равенстве, то рассчитаем и вероятность того, что полученная величина меньше ожидаемой:
Полученная оценка среднеквадратичного отклонения
15,9
Ожидаемая величина среднеквадратичного отклонения
Число наблюдений N
Полученная оценка дисперсии
252,81
Ожидаемая дисперсия
Отношение оценки и ожидаемого значения
1,755625
Полученная величина хи-квадрат
59,69125
Вероятность того, что хи-квадрат будет больше полученного
0,00418088
Вероятность того, что хи-квадрат будет меньше полученного
=1-В8
Теперь доверительная вероятность будет равна минимуму из вероятностей того, что мы получили столько, сколько ожидали, или меньше, и что мы получили столько, сколько ожидали, или больше: