В условиях недостаточности средних используют структурные средние величины — моду и медиану.
Медиана (Ме) — это вариант, который находится а середине вариационного ряда. Медиана делит ряд на две равные (по числу наблюдений) части. В ранжированных рядах не сгруппированных данных нахождение медианы сводится к отысканию порядкового номера и значения варианта у этого номера.
Медиана в интервальныхвариационных рядах рассчитывается по формуле:
, (1.17)
где х0 — нижняя граница медианного интервала (накопленная частота которого превышает половину общей суммы частот);
Также в интервальных вариационных рядах медиана может быть найдена с помощью кумуляты как значение признака, для которого
или . (1.18)
Главное свойство медианы заключается в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины: .
Модой(Мо) вариационного ряда называется вариант, которому соответствует наибольшая частота.
Для вычисления моды в интервальном ряду сначала находится модальный интервал, имеющий наибольшую частоту (или наибольшую плотность распределения — отношение частоты интервала к его величине ni/hi — в интервальном ряду с неравными интервалами), а значение моды определяется линейной интерполяцией:
, (1.19)
где хо — нижняя граница модального интервала;
— величина модального интервала;
, , — частота ni (в интервальном ряду с равными интервалами) или плотность распределения ni/hi (в интервальном ряду с неравными интервалами) модального, до и послемодального интервала.
Мода так же, как и медиана обладает определенной устойчивостью к вариации признака. Если в совокупности первичных признаков нет повторяющихся значений, то для определения моды проводят группировку.
Графически отобразить моду по гистограмме можно следующим образом: нужно взять столбец, имеющий наибольшую высоту, и из его левого верхнего угла провести отрезок в угол последующего столбца, а из правого угла — в верхний правый угол предыдущего столбца, абсцисса точки пересечения отрезков и будет соответствовать модальному значению признака в изучаемой совокупности. Медиану приближенно можно определить графически - по кумуляте. Для этого высоту наибольшей ординаты, которая соответствует общей численности совокупности, делят пополам. Через полученную точку проводят прямую, параллельную оси абсцисс, до пересечения ее с кумулятой. Абсцисса точки пересечения и есть медиана (рисунок 1.1)
Рис. 1.1 Графическое отображение интервального вариационного ряда
В симметричных рядах имеет место следующее соотношение моды, медианы и средней арифметической (1.20).
В случае, если (1.21), имеет место левосторонняя асимметрия ряда.
В случае, если (1.22), имеет место правосторонняя асимметрия ряда.
Мода и медиана,в отличие от степенных средних, являются конкретными характеристиками ряда. Медиана — характеризует центр, вычисляется проще и не чувствительна к концам интервала. Мода — наиболее вероятное значение в изучаемой совокупности (например, наиболее возможные результаты).
1 2 3
1 — распределение с левосторонней асимметрией
2 — распределение с правосторонней асимметрией
3 — нормальное (симметричное) распределение
Анализ вариационных рядов
Показатели вариации
Вариациейназывается изменяемость, колеблемость величины признака. Вариация проявляется в отклонениях от средних и зависит от множества факторов, влияющих на социально-экономическое явление. Вариация бывает случайной и систематической, существует в пространстве и во времени. Показатели вариации делятся на абсолютные и относительные (таблица 2.1).
Таблица 2.1 - Показатели вариации
Показатель
Формула расчета показателя
простой
взвешенный
Абсолютные
Размах
(2.1)
Среднее
линейное
отклонение
(2.2)
* (2.3)
Дисперсия
σ2 (2.4)
(2.5)
Среднее
квадратическое отклонение
(2.6)
(2.7)
относительные
Коэффициент
вариации
(2.8)
Линейный
коэффициент
вариации
(2.9)
Коэффициент
осцилляции
(2.10)
* — Здесь fi — частота ().
Относительные показатели (коэффициент вариации, линейный коэффициент вариации, коэффициент осцилляции) строятся с учетом базы (в виде средней), выражаются в процентах и дают характеристику однородности совокупности. Совокупность считается однородной, если коэффициент вариации
. (2.11)
Для расчета дисперсии можно использовать модифицированную формулу:
. (2.12)
Выведем эту формулу из формулы (2.5)
Для расчета дисперсии можно использовать способ отсчета от условного нуля, который позволяет упростить вычисления при больших значениях признака. Тогда дисперсия вычисляется по формуле:
, (2.13)
где h — величина интервала;
А — условный нуль, в качестве которого можно использовать как середину серединного интервала, так и середину интервала с наибольшей частотой.
Свойства дисперсии
1.Дисперсия постоянной величины равна нулю.
2.Если у всех значений вариантов отнять какое-то постоянное число А, то средний квадрат отклонений (дисперсия) от этого не изменится
. (2.14)
Это значит, что дисперсию можно вычислить не по заданным значениям признака, а по их отклонениям от какого-то постоянного числа, например условного нуля (см. формулу 2.13).
3.Если все значения вариантов разделить на какое-то постоянное число А, то дисперсия уменьшится в А2 раз:
. (2.15)
4.Если распределение признака близко к нормальному или симметричному, то по правилу мажорантности (т.к. среднее квадратическое отклонение — средняя геометрическая величина, а среднее линейное отклонение — средняя арифметическая) среднее квадратическое отклонение больше среднего линейного отклонения (), причем
, . (2.16)
Размах вариации, среднее линейное и среднее квадратичное отклонение — это именованные величины. Единицей измерения у них и у исходных значений признака совпадают. Дисперсия может быть задана в ед.2 признака или в % отклонений.