Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Ряды распределения, построенные по качественным признакам, называют атрибутивными, по количественному – вариационными. Представленные данные всех вариантов ряда без какой-либо систематизации образуют первичный ряд данных, который необходимо упорядочить. Первым шагом является ранжирование – расположение всех вариантов ряда в возрастающем или убывающем порядке. Ранжированный ряд позволяет сразу увидеть наименьшее и наибольшее значение признака, определить расстояние между крайними значениями, выделить наиболее часто повторяющиеся значения, а также разделить все данные по группам.
Признаки рядов по характеру вариации бывают дискретные (даны в виде прерывных целых чисел) и непрерывные (могут принимать любое значение). Способы построения вариационного ряда для этих признаков различны. Для построения дискретного ряда с небольшим числом вариантов достаточно перечислить все варианты значения признака, затем подсчитать частоту повторения каждого варианта. Когда число вариантов дискретного признака достаточно велико, а также при анализе вариации непрерывного признака стоятся интервальные ряды распределения. Для этого необходимо установить число групп, их интервалы. Ряды распределения оформляются в таблицах или графически. График дискретного ряда:
1
2 3
Кривые распределения 2 и 3 имеют одинаковый размах вариации и характер распределения частот, но отличаются величиной варьирующего признака. Кривые 1 и 2 отличаются пределами вариации. Для графического изображения интервальных вариационных рядов применяется гистограмма.
Показатели размеров вариации: размах, среднее линейное отклонение, дисперсия и среднее квадратическое отклонение; коэффициент вариации; их расчет по сгруппированным и не сгруппированным данным.
Для изменения вариации признака применяются различные абсолютные и относительные величины. К абсолютным относятся: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.
Размах вариации – представляет собой разность между максимальным и минимальным значениями признака совокупности: R = xmax - xmin
Среднее линейное отклонение:
для несгруппированных данных
для сгруппированных данных
Дисперсия – средняя из квадратов отклонений вариантов значений признака от их средней величины.
для несгруппированных данных
для сгруппированных данных
Среднее квадратическое отклонение представляет собой корень квадратный из дисперсии
для несгруппированных данных
для сгруппированных данных
Наиболее часто применяемый показатель относительной вариации – коэффициент вариации. Его используют для характеристики однородности совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33%.