Общая дисперсия s2 измеряет вариацию результативного признака (y) во всей совокупности под влиянием всех факторов (x1, x2, x3…) обусловивших эту вариацию.
Межгрупповая дисперсия характеризует систематическую вариацию, т.е. различия в величине изучаемого признака, возникающие под влиянием признака-фактора (x), положенного в основание группировки. Она рассчитывается по формуле
,
где `yi и ni — соответственно групповые средние и численности по отдельным группам.
Внутригрупповая дисперсия ( ) отражает случайную вариацию, т. е. часть вариации, происходящую под влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она исчисляется следующим образом:
Средняя из внутригрупповых дисперсий ( ):
Существует закон, связывающий три вида дисперсии. Общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсией:
В статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии. Он носит название эмпирического коэффициента детерминации ( ):
.
Этот коэффициент показывает долю (удельный вес) общей вариации изучаемого признака обусловленную вариацией группировочного признака.
Корень квадратный из эмпирического коэффициента детерминации носит название эмпирического корреляционного отношения (h):
.
Оно характеризует влияние признака, положенного в основание группировки, на вариацию результативного признака. Эмпирическое корреляционное отношение изменяется в пределах от 0 до 1. Если h = 0, то группировочный признак не оказывает влияние на результативный. Если h = 1, то результативный признак изменяется только в зависимости от признака, положенного в основание группировки, а влияние прочих факторных признаков равно нулю. Промежуточные значения оцениваются в зависимости от их близости к предельным значениям.
Пример 6.4. Имеются данные о группе рабочих.
Число обслуживаемых
станков (х)
Число
рабочих
(ni)
Средняя
зарплата
Дисперсия
зарплаты в группе
5,8
6,8
9,3
итого
Оценить силу связи между признаками.
Решение: Даны групповые средние и внутригрупповые дисперсии.
Определим среднюю общую используя групповые средние
тыс.руб.
Средняя из внутригрупповых дисперсий
Межгрупповая дисперсия
Общая дисперсия s2 =6,955 + 34,65 = 41,605
Эмпирический коэффициент детерминации
= 34,65 / 41,605 = 0,833
Эмпирическое корреляционное отношение
Такое значение (близко к 1) характеризует очень сильную связь между числом обслуживаемых станков и средней зарплатой.