Значительно более сильно будет выделяться корреляционная зависимость, если применять метод группировки и сравнивать не индивидуальные значения, а групповые средние.
Такой прием единственно возможный, если нужно выявить зависимость на примере 100, 1000 единиц. При этом необходимо образовать такое количество групп, при котором в вариации групповых средних в максимальной степени будет проявляться влияние группировочного признака.
Чем больше групп образуется, тем больше увеличивается межгрупповая вариация, но при этом нельзя растягивать группировку, особенно при небольшом числе наблюдений. В этом случае группы получаются малочисленные и средние из них будут носить случайный характер, а межгрупповая вариация будет отражать не только влияние фактора признака, но и других факторов. Следовательно, нужно выбрать оптимальное число групп для конкретного случая, чтобы групповые средние перестали носить случайный характер и с каждой новой группой имели тенденцию к росту или снижению.
Составим группировку, состоящую из 4 групп: по энерговооруженности
Группы
х
у
Группы
у
6,0-7,325
26,1
3,75
6,0-7,1
2,2
7,33-8,65
3,5
7,1-8,2
1,8
8,65-9,98
6,5
8,2-9,3
4,6
9,98-11,31
5,25
9,3-10,4
2,4
Оптимальной является вторая группировка, т.к. здесь нет ни одного исключения тенденции к росту групповой средней. Арифметические группировки характеризуют лишь общие черты связи между признаками и не дают ответа о силе связи. Силу связи можно определить, рассчитав эмпирическое корреляционное отношение (К детерминации ).
Для этого необходимо произвести следующие этапы:
- определить дисперсию групповых средних, расчет ведем по второй группировке и по формуле:
- определить общую дисперсию по уровням производительности труда:
- определить коэффициент детерминации ( ). Коэффициент детерминации определяется путем деления дисперсии групповых средних на общую дисперсию:
коэффициент детерминации показывает, сто энерговооруженность предприятия определяет изменение производительности труда, а эмпирическое корреляционное отношение показывает, что связь между энерговооруженностью и производительностью труда высокая, т.к. изменяется в пределах от 0 до 1, если связи отсутствуют, то =0, если находится в пределах от 0,1 до 0,3 – связь слабая.