Вычисления проводятся по следующему алгоритму: 1. Вычисляем средние арифметические рядов X и У: Е Ух= 468 2И>= 621
= 52;
= 69.
М, =-
АГ. =-
N 9 '" '">• N 9
2. Определяем отклонения вариант каждого ряда от своей средней (^ и </,.) (графы 3 и 4. табл. 14):
«4 = к,-а/» л, = у,-м.
3. Находим произведение а* на ау(графа 5, табл. 14). Полученные значе ния суммируются с учетом знаков.
4. Возводим в квадрат <4 и Луи суммируем полученные значения (графа 6 и 7. табл. 14):
5. Вычисляем коэффициент корреляции:
42 .
VI 12x48
68
73,3
= 0,92.
Для вычисления коэффициента корреляции рангов используется следующая формула:
Вывод:Так как коэффициент корреляции гху= +0,92, следовательно, между содержанием в крови железа и гемоглобина отмечается сильная и прямая корреляционная связь, т. е. чем больше содержание железа в крови, тем выше уровень гемоглобина.
Поскольку исследование проводилось на выборочной совокупности, необходимо оценить достоверность коэффициента корреляции.
1-г
ГПг = •
Для оценки достоверности коэффициента корреляции вычисляется его средняя ошибка: г
\-г
— при числе наблюдений более 100;— при числе наблюдений от 30 до 100;
\-г'
при числе наблюдений менее 30.
В рассмотренном примере 18 следует использовать последнюю формулу, поскольку число наблюдений равно 9:
= 0,029.
1-г2 1 - 0,922 0,078 _ 0,078 77 ~ 2,65
Для оценки величины полученной ошибки следует использовать критерий достоверности (I).
р = 1 ^
й(«2-1Г
где р — (греческая буква «ро») — коэффициент корреляции рангов; а— разность между ранговыми номерами; п — число парных членов в коррелируемых
рядах.
Пример 19:вычислить коэффициент корреляции рангов между величиной расходов на здравоохранение на душу населения и смертностью детей в
иозрасте до 5 лет (таблица 15).
Таблица 15
Зависимость смертности детей в возрасте 5 лет от расходов на здравоохранение на душу населения в странах в 1997 г.
Страны
Смертность Расходы детей в возрасте на здравоох. до 5 лет на 1 жителя (на 1000 жив.) (5США)
Ранги
Разность рангов Л
Квадрат | разности рангов
а*
X
У
2 3
4
Индия
90 24
|
1 '
Иран
57 139
—2
4
Ливан
33 503
-5
Пакистан
99 18
Польша
18 ; 228
-5
Ирак
113 I 125
4
Афганистан
246 : 6
ГПт
Значение критерия (I) оценивается по специальной таблице Стьюдента. Если полученное значение (I) больше табличного для выбранного уровня доверия и числа степеней свободы, то коэффициент корреляции считается достоверным. В рассмотренном примере I = 37,1.
Это значение больше табличного, что подтверждает достоверность выявленной сильной связи и взаимозависимости анализируемых явлений.
II. Коэффициент корреляции рангов (р)относится к непараметрическим критериям и предложен Спирменом. Он используется при необходимости получения быстрого результата, при малом числе наблюдений, а также в тех случаях, когда изучаемые признаки не имеют точных количественных значений или носят описательный характер. Этот метод основан на определении ранга (места) каждого из значений ряда.
При сопоставлении показателя смертности детей в возрасте до 5 лет и расходов на здравоохранение на 1 жителя ($США) отмечается снижение частоты смерти детей в возрасте до 5 лет с увеличением расходов на здравоохранение. Следует определить степень связи между этими показателями и достоверность полученного результата.
Вычисления проводятся по следующему алгоритму:
1. Определить ранги по значению каждой величины ряда. Если первый ряд (.х) ранжируется от меньшего значения к большему, то второй ряд (у) сле дует ранжировать в том же порядке (графа 4 и 5, табл. 15).
2. Определить разность рангов каждой пары ряда (х) и ряда (у): (ау= (х) (у) (графа 6, табл. 15). Они в сумме с учетом знаков равны нулю.
3. Возвести в квадрат полученные разности и суммировать их. В нашем примере ^_с1-ху= 8 (графа 7, табл. 15).
4. Рассчитываем коэффициент корреляции рангов:
= —0,86.
6x104 624
п(п2-!) 7(72-1) 336
Вывод:связь сильная, обратная (р = -0,86). Между смертностью детей в возрасте до 5 лет и расходами на здравоохранение на 1 жителя существует сильная и обратная связь, с увеличением расходов на здравоохранение снижается смертность детей в возрасте до 5 лет.
Прежде чем судить о степени связи между изучаемыми признаками, необходимо оценить достоверность коэффициента корреляции рангов. При п > 9 следует рассчитать критерий / по формуле:
п-1
Полученное значение критерия ( оценивается по таблице /-критерия Стьюдентадля числа степеней свободы п' = п-2. Если п < 9, оценка достоверности коэффициента корреляции рангов проводится по специальной таблице критических значений коэффициента корреляции Спирмена (р). Коэффициент корреляции незначим, если рассчитанное значение меньше табличного.
РЕГРЕССИЯ
Прямолинейная корреляция отличается тем, что при этой форме связи каждому значению одного признака соответствует определенное в среднем значение другого признака. Рассмотренный нами коэффициент корреляции указывает лишь на направление и силу связи двух величин, не дает судить о том, как количественно меняется величина признака по мере изменения другой величины. Применение метода регрессии позволяет ответить на этот вопрос.
Та величина, на которую в среднем изменяется второй признак при изменении первого на единицу, называется коэффициентом регрессии.
Для расчета коэффициента регрессии(Кл) используется следующая формула:
*Ух/у =ХГ*У>
СУх
где о, и ау— среднеквадратические отклонения ряда X и ряда 7; г „у — коэффициент корреляции.
Рассмотрим методику расчета коэффициента регрессии на примере 20.
При анализе физического развития 7-летних мальчиков были получены следующие средние значения роста М(х) и массы тела М(у):
М(х) = 118,4 см о, = ± 6,0 см;
М(у) = 24,0 кг су = ± 2,6 кг.
Коэффициент корреляции (гху) между весом и ростом составил +0,7.
Расчет коэффициента регрессии выполняется по формуле:
2,6_ "6,0
СУу
= ----- ХГху,
(Тх
х 0,7 = 0,3(кг)
Вывод:с изменением роста 7-летних мальчиков на 1 см, масса тела в среднем изменяется на 0,3 кг.
С помощью коэффициента регрессиибез специальных измерений можно определить величину одного из признаков, например, массы тела, зная значение другого (роста). С этой целью используется уравнение линейной регрессии:
у = Му+'КХу(х-М1),
где у — искомая величина массы тела; Му— среднее значение массы тела, характерное для данного возраста; К.^ — коэффициент регрессии массы тела по росту; х — известная величина роста; Л/т— среднее значение роста.
Пример21: определим, какова будет масса тела 7-летних мальчиков при росте 120 см, если среднее значение массы Муравно 24 кг, а средний рост равен 118 см. Подставим в уравнение линейной регрессии известные данные и получим:
у = Му + К*у (х - Мх) = 24 + 0,3 (120 - 118) = 24,6 кг.
I Вывод:группа 7-летних мальчиков с ростом 120 см должна иметь среднюю массу тела 24.6 кг.
Коэффициенты регрессии и уравнения линейной регрессии широко применяются для составления шкал регрессии,которые используются при индивидуальной оценке физического развития.