Если исходная совокупность является такой, что по значениям признака она делится на l групп, то общая дисперсия складывается из частных дисперсий. В таблице 2.2 представлен анализ такой совокупности.
Таблица 2.2 - Определение исходной совокупности по группам
Значение признака х
Число единиц в j-й группе
Итого
…
j
…
l
х1
f11
…
f1j
…
f1l
…
…
…
…
…
…
…
хi
fi1
…
fij
…
fil
…
…
…
…
…
…
…
хk
fk1
…
fkj
…
fkl
Итого
…
…
Здесь j — номер группы ();
хi — i-е значение признака ();
fij — частота i-го значения признака, число единиц в j-й группе;
mi — сумма частот i-го значения признака в каждой группе;
nj — сумма частот всех значений признака в j-й группе;
N — сумма частот всех значений признака во всех группах (объем совокупности).
Сначала вычисляем l частных средних (), т.е. среднее значение признака в каждой группе:
. (2.22)
На основе частных средних определяем общую среднюю () по формулам
или . (2.23)
Общая дисперсиясовокупности
. (2.24)
Общая дисперсия отражает вариацию признака за счет всех факторов, действующих в данной совокупности.
Вариацию между группами за счет признака-фактора, положенного в основу группировки, отражает межгрупповая дисперсия, которая исчисляется как средний квадрат отклонений групповой средней от общей средней:
Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, т.е. вариацию между группами за счет признака-фактора, положенного в основу группировки.
Вариацию внутри каждой группы изучаемой совокупности отражает внутригрупповая дисперсия, которая исчисляется как средний квадрат отклонений значений признака х от частной средней :
или . (2.26)
Для всей совокупности внутригрупповую вариацию будет выражать средняя из внутригрупповых дисперсий, которая рассчитывается как средняя арифметическая из внутригрупповых дисперсий:
. (2.27)
Внутригрупповая дисперсия отражает случайную вариацию, т.е. часть вариации обусловленную влиянием неучтенных факторов и не зависящую от признака-фактора, положенного в основу группировки.
Между представленными видами дисперсий существует определенное соотношение, которое известно как правило сложения дисперсий:
. (2.28)
Таким образом, общая дисперсия складывается из двух слагаемых: первое — средняя из внутригрупповых дисперсий — измеряет вариацию внутри частей совокупности, второе — межгрупповая дисперсия — вариацию между средними этих частей.
Правило сложения дисперсий позволяет выявить зависимость результатов от определяющих факторов с помощью соотношения межгрупповой и общей дисперсий. Это соотношение называется эмпирическим коэффициентом детерминации (η2) и показывает долю вариации результативного признака под влиянием факторного.
. (2.29)
Эмпирическое корреляционное отношение (η) показывает тесноту связи между исследуемым явлением и группировочным признаком.
. (2.30)
η2 и η [0, 1]. (2.31)
Если связь отсутствует, то h = 0. В этом случае межгрупповая дисперсия равна нулю (δ2=0), т.е. все групповые средние равны между собой и межгрупповой вариации нет. Это означает, что группировочный признак не влияет на вариацию исследуемого признака х.
Если связь функциональная, то h = 1. В этом случае дисперсия групповых средних равна общей дисперсии (). Это означает, что группировочный признак полностью определяет характер изменения изучаемого признака.
Чем больше значение корреляционного отношения приближается к единице, тем полнее (сильнее) корреляционная связь между признаками (таблица 2.3).
Таблица 2.3 - Качественная оценка связи между признаками (шкала Чэддока)
Значение
Характер связи
Значение
Характер связи
η = 0
Отсутствует
0,5 ≤ η < 0,7
Заметная
0 < η < 0,2
Очень слабая
0,7 ≤ η < 0,9
Сильная
0,2 ≤ η < 0,3
Слабая
0,9 ≤ η < 1
Весьма сильная
0,3 ≤ η < 0,5
Умеренная
η = 1
Функциональная
Пример 2.1.
Определим групповые дисперсии, среднюю из групповых дисперсий, межгрупповую дисперсию, общую дисперсию по данным о производительности труда в двух бригадах:
Изготовлено деталей за час, шт. (производительность труда)
Количество рабочих, имеющих соответствующую производительность труда
в бригаде 1
в бригаде 2
хi
fi1
fi2
Промежуточные расчеты занесем в таблицы:
хi
Бр. 1
Бр. 2
mi
Промежуточные расчеты для определения средних величин
fi1
fi2
хi·fi1
хi·fi2
хi·mi
Σ
n1=10
n2=10
N=20
Σхi·fi1=138
Σхi·fi2=178
Σхi· mi =316
хi
Промежуточные расчеты для определения дисперсий
(хi —)
(хi —)
(хi—)
(хi —)2·fi1
(хi —)2·fi2
(хi—)2·mi
-3,8
-7,8
-5,8
14,44
0,00
33,64
-1,8
-5,8
-3,8
9,72
0,00
43,32
0,2
-3,8
-1,8
0,12
14,44
12,96
2,2
-1,8
0,2
9,68
9,72
0,20
4,2
0,2
2,2
17,64
0,08
14,52
6,2
2,2
4,2
0,00
19,36
70,56
Σ
—
—
—
51,60
43,60
175,20
Средняя производительность труда для 1-й бригады:
= 13,8 шт./ч.
Средняя производительность труда для 2-й бригады:
= 17,8 шт./ч.
Средняя производительность труда для 1-й и 2-й бригады:
= 15,8 шт./ч.
Дисперсия 1-й группы (бригады)
= 5,16
Дисперсия 2-й группы (бригады)
= 4,36
Средняя из групповых дисперсий
= 4,76
Межгрупповая дисперсия
= 4,0
Общая дисперсия
=8,76
Проверка по правилу сложения дисперсий:
= 4,76 + 4,00 = 8,76
Эмпирический коэффициент детерминации:
= 0,457 = 45,7%.
Отсюда можно сделать вывод, что общая вариация производительности труда на 45,7% обусловлена вариацией между группами.
Эмпирическое корреляционное отношение
= 0,6757.
Значение h = 0,6757 показывает заметную связь по шкале Чэддока (см. таблицу 2.3) между исследуемым явлением (производительностью труда) и группировочным признаком (бригады).