1. Выбор группировочного признака — признака, по которому производится разбиение совокупности на отдельные группы. В качестве признака необходимо использовать существенные обоснованные признаки. Группировочный признак — это основание (свойство объекта) для разделения объектов на группы.
Признаки различаются:
· по форме выражения (атрибутивные и количественные);
· по характеру колебания (альтернативные «да», «нет»; множественные);
· по роли во взаимосвязи явлений (результативные — могут меняться в зависимости от ситуации и целей анализа; факторные — воздействующие на другие признаки).
2. Определение количества групп. Если в основание группировки положен атрибутивный признак, то количество групп будет столько, сколько существует градаций (уровней) данного признака. Если основание группировки — количественный признак, то при определении количества групп в каждом конкретном случае следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования.
Если совокупность состоит из большого числа единиц и распределение единиц по группировочному признаку близко к нормальному, для определения количества групп (m) используют формулу Стерджесса:
m = 1+3,322·lg N, (2.1)
где N — численность единиц совокупности.
Таблица 2.4 - Номограмма по формуле Стерджесса
N
15¸24
25¸44
45¸89
90¸179
180¸359
360¸719
720¸1489
m
3. Определение интервала группировки. Интервал — это значение варьирующего признака, лежащее в определенных границах.
Если вариация признака происходит в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами:
, (2.2)
где h — величина интервала;
xmax, xmin — максимальное и минимальное значения группировочного признака в совокупности;
m — число групп.
Величина интервала округляется до ближайшего целого числа, или же кратного 10, 50, 100.
Возможны и другие варианты определения интервала группировки.
Интервалы могут быть двух видов:
· закрытыми, когда у интервала указаны обе границы;
· открытыми, когда у первого интервала указана верхняя граница, а у последнего — нижняя (например, в таблице 2.3, 1-я группа населения по размеру среднедушевого дохода — до 1000 руб.; последняя — 10000 и более).
Возможно построение вторичных группировок. Основные задачи, вторичной группировки:
· приведение данных к сопоставимым результатам;
· укрупнение интервалов;
· долевая перегруппировка (образование новых групп с меньшими интервалами).
Имеются первичные данные о количестве работников определенного возраста.
Возраст, лет
Число сотрудников
Произведем группировку работников предприятия по возрасту. Для этого по формуле (2.1) рассчитаем число групп
m = 1+3,322·lg 39 = 6,28 ≈ 6.
Определим интервал группировки по формуле (2.2)
.
Округлим величину интервала до ближайшего целого h = 7.
Тогда группировка будет следующей:
Возраст, лет
Число сотрудников
Границы интервалов
20 — 27
27 — 33
33—40
40—47
47 — 54
54 — 60
Число сотрудников в интервале
Граничное значение входит в тот интервал, где оно является верхней границей.
Произведем вторичную группировку с укрупнением интервалов (h = 10):
Возраст, лет
Число сотрудников
Границы интервалов
20 — 30
30 — 40
40 — 50
50 — 60
Число сотрудников в интервале
Вариационные ряды
При изучении совокупности интересующий нас признак у различных единиц совокупности принимает различные значения, т.е. он имеет некоторую вариацию.
Вариацией признака называется наличие различий в численных значениях признаков у отдельных единиц совокупности.
Чтобы выявить характер распределения единиц совокупности по варьирующим признакам, определить закономерности в этом распределении, строят ряды распределения единиц совокупностей по какому-либо варьирующему признаку.
Ряды распределения, построенные по количественному признаку называются вариационными.
При анализе вариационных рядов решают следующие задачи:
1) Определение меры вариации, т.е. количественное измерение степени колеблемости признака. Это позволяет сравнивать различные совокупности между собой по степени рассеяния и отслеживать уровень вариации признака одной и той же совокупности в различные периоды.
2) Исследование закономерностей вариации в статистических совокупностях для изучения причин, вызывающих вариацию.
Для описания статистических распределений обычно используются следующие виды характеристик (показателей):