При анализе характера связи двух непрерывных переменных желательно тоже иметь графическое выражение характера связи. Для этого выполним команду Graphs / Scatter и выберем две интересующие нас переменные по осям X и Y. Например, проанализируем характер связи ЧСС(pulse of the patient in minuite) и частоты дыхания (respiratory rate), коэффициент корреляции между которыми был около +0,5:
В результате получили
На графике каждая пара переменных представлена точкой с соответствующими координатами. Здесь каждый больной обозначается квадратиком, и хорошо видно, что с увеличением одного показателя в целом увеличивается другой.
В SPSS можно также маркеры делать в зависимости от значения третьей переменной. Например, выберем «Умер» в качестве таковой:
В результате получили:
Видно, что умершие (зеленые квадратики) больше группируются в правом верхнем углу, соответствующем учащенным частотам дыхания и сердцебиения.
К сожалению, статистические пакеты определяют лишь достоверность отличия коэффициента корреляции от нуля. Поэтому остальные стандартные расчеты по определению достоверности отличий придется делать «руками».
В этом нам поможет преобразование Фишера. Фишер предложил очень практичное преобразование случайной величины r – выборочного коэффициента корреляции:
z = 0.5ln((1+r)/1-r)).
С помощью этого преобразования плотность распределения величины r превращается в плотность нормального распределения (распределения Гаусса) величины z с дисперсией D = 1/(N-3) и средним m ≈ 0.5ln((1+ρ)/1- ρ)). Иными словами, плотность распределения преобразования Фишера от оценки коэффициента корреляции по N наблюдениям имеет математическое ожидание, равное преобразованию Фишера от истинного значения коэффициента корреляции ρ = М(r), и дисперсию 1/(N-3). Насколько хорошо преобразование Фишера реализует переход к нормальному распределению иллюстрируют рисунки приведенные ниже.
С помощью z-преобразования можно решать следующие задачи:
1. Согласуется ли выборочный коэффициент корреляции r с предполагаемым значением теоретического коэффициента корреляции ρ.
2. Найти доверительные границы для ρ по наблюденному значению r.
3. Соответствуют два выборочных значения коэффициента корреляции r1 и r2 предполагаемому значению теоретического коэффициента корреляции ρ.
Рассмотрим следующие примеры:
Пример 1. По выборке, состоящей из 25 пар наблюдений, было определено значение коэффициента корреляции равным r = 0.6 . Найти доверительные границы для истинного коэффициента корреляции ρ.
По заданному значению r находим z = 0.693 .
Квадратичное отклонение z равно σ(z) = 1/(25-3)0.5 =0.213 .
Значит, доверительными границами для z с уровнем значимости 0.05 будут
Дисперсии z1, z2 и d равны σ2(z1) = 1/17 = 0.0588, σ2(z2) = 1/22 = 0.0455,
σ2(d) = σ2(z1)+ σ2(z2) = 0.1043 .
Отношение d/σ(d) будет подчиняться нормальному распределению (Гаусса) со средним m = 0 и дисперсией D = 1. В нашем случае d/σ(d) = 1.26 . Поскольку для доверительного уровня р = 0.05 доверительный интервал составит +-2σ = +-1.96, (или приближенно +-2σ ≈ +-2 ) отличие r1 от r2 следует считать незначимым.
Рассмотрим подобные примеры в Excel, так как эта программная среда реализует как прямое так и обратное преобразование Фишера.