Задания для самостоятельной работы. Тема: Средние величины
Тема: Средние величины
Цель занятия: Освоение методики вычисления средних величин.
План занятия:
I. Рассмотрение теоретических основ вычисления и использования средних величин.
1. Средние величины, их виды и область применения.
2. Вариационный ряд, методика его построения и характеристика.
3. Методы вычисления средней арифметической (средней арифметической простой и взвешенной, по способу моментов).
4. Среднеквадратическое отклонение, методика его вычисления и область применения.
5. Методика вычисления и использование коэффициента вариации.
II. Методика вычисления средних величин, среднеквадратических отклонений.
Основные понятия и определения по теме
Для характеристики изучаемой совокупности по количественным признакам используются различные показатели, в том числе и средние величины, которые показывают средний уровень изучаемого признака.
Средние величины используются в здравоохранении:
– для оценки здоровья населения (показатели физического развития, средняя длительность пребывания на больничном листе и т.д.);
– для оценки деятельности лечебно-профилактических учреждений (средняя длительность работы койки в году, оборот койки и т.д.);
– для планирования (число жителей на терапевтическом, педиатрическом участке, стоимость одного койко-дня и т.д.);
– для оценки санитарно-гигиенических параметров (освещенность, температура, влажность воздуха и т.д.);
– для определения разовых доз лекарственных веществ и т.д.
Средний уровень изучаемого явления – одно из групповых свойств статистической совокупности. Средний уровень измеряют с помощью критериев, которые носят название средних величин.
Средние величины обладают тремя свойствами:
– средняя занимает срединное положение в вариационном ряду;
– средняя выражает общую меру изучаемого явления;
– сумма отклонений всех вариант от средней равна нулю.
Наиболее широко используются три средние величины:
– мода (Мо) – соответствует величине признака, который чаще встречается в статистической совокупности, т.е. варианте наиболее часто встречающейся в вариационном ряду;
– медиана (Ме) – варианта, занимающая срединное положение в вариационном ряду и делящая его пополам. Для того, чтобы узнать значение медианы, необходимо определить порядковый номер варианты, занимающей срединное положение (n/2), где n – число вариант в вариационном ряду. При нечетном числе вариант используется формула n+1/2;
– средняя арифметическая (простая, взвешенная).
Для определения средних величин в статистической совокупности необходима предварительная обработка и систематизация данных исследования, а именно, построение вариационного ряда.
Вариационный ряд – это ряд числовых измерений определенного признака, отличающихся друг от друга по величине и расположенных в определенном порядке.
Вариационный ряд может быть:
– простой, несгруппированный;
– сгруппированный;
– прерывный или непрерывный;
– правильный или неправильный;
– ранжированный или неранжированный.
Обозначения, используемые в вариационном ряду:
– варианта (V) – отдельное числовое выражение изучаемого признака;
– частота (р) – количество вариант определенной величины;
– число наблюдений (n) – общее число вариант в вариационном ряду.
Если число наблюдений не превышает 30, то варианты можно расположить по возрастанию или убыванию, т.е. построить простой вариационный ряд.
Пример: получены данные о длительности лечения в поликлинике 45 больных ангиной (в днях): 20, 18, 19, 16, 17, 16, 14, 13, 15, 14, 15, 13, 12, 13, 3, 4, 12, 11, 12, 11, 10, 12, 11, 10, 11, 8, 7, 11, 11, 10, 10, 10, 9, 8, 8, 9, 4, 5, 6, 9, 5, 9, 6, 7, 7.
Строим вариационный ряд:
Таблица 1
V
åp=45
p
a
-8
-7
-6
-5
-4
-3
-2
-1
åpa=-23
pxa
-8
-14
-12
-10
-12
-9
-8
-5
Определяем средние величины:
Мода (Мо) =11, т.к. данная варианта встречается в вариационном ряду наиболее часто (р=6).
Медиана (Ме) – порядковый номер варианты занимающей срединное положение , это место в вариационном ряду занимает варианта равная 11.
Средняя арифметическая (М) позволяет наиболее полно охарактеризовать средний уровень изучаемого признака. Для вычисления средней арифметической используется два способа:среднеарифметический способ и способ моментов.
Если частота встречаемости каждой варианты в вариационном ряду равна 1, то рассчитывают среднюю арифметическую простую, используя среднеарифметический способ: .
Если частота встречаемости вариант в вариационном ряду отличается от 1, то рассчитывают среднюю арифметическую взвешенную, по среднеарифметическому способу: .
По способу моментов: А – условная средняя,
d=V-A, А=Мо=11
Если число вариант в вариационном ряду более 30, то строится сгруппированный ряд. Построение сгруппированного ряда:
1) определение Vmin и Vmax Vmin=3, Vmax=20;
2) определение количества групп (по таблице);
3) расчет интервала между группами ;
4) определение начала и конца групп;
5) определение частоты вариант каждой группы (таблица 2).
Таблица 2
Методика построения сгруппированного ряда
Длительность лечения в днях (V)
Число больных (р)
V ср. гр.
Vxp
d=V-Mo
d*p
d2
d2*p
3-5
-6
-30
6-8
-3
-24
9-11
12-14
15-17
18-20
n=45 åVp=480 ådp=30 åd2p=766
Преимущество сгруппированного вариационного ряда заключается в том, что исследователь работает не с каждой вариантой, а только с вариантами, являющимися средними для каждой группы. Это позволяет в значительной степени облегчить расчеты средней.
Величина того или иного признака неодинакова у всех членов совокупности, несмотря на ее относительную однородность. Данную особенность статистической совокупности характеризует одно из групповых свойств генеральной совокупности – разнообразие признака. Например, возьмем группу мальчиков 12 лет и измерим их рост. После проведенных расчетов средний уровень данного признака составит 153 см. Но средняя характеризует общую меру изучаемого признака. Среди мальчиков данного возраста есть мальчики, рост которых составляет 165 см или 141 см. Чем больше мальчиков будут иметь рост отличный от 153 см, тем больше будет разнообразие этого признака в статистической совокупности.
Статистика позволяет охарактеризовать данное свойство следующим критериями:
– лимит (lim),
– амплитуда (Amp),
– среднеквадратическое отклонение (s),
– коэффициент вариации (Сn).
Лимит (lim) определяется крайними значениями вариант в вариационном ряду: lim=Vmin Vmax
Амплитуда (Amp) – разность крайних вариант:
Amp=Vmax-Vmin
Данные величины учитывают только разнообразие крайних вариант и не позволяют получить информацию о разнообразии признака в совокупности с учетом ее внутренней структуры. Поэтому данными критериями можно пользоваться для приближенной характеристики разнообразия, особенно при малом числе наблюдений (n<30).
Наиболее полную характеристику разнообразию признака в совокупности дает среднеквадратическое отклонение (s).
Существует два способа расчета среднеквадратического отклонения: среднеарифметический и способ моментов.
Среднеарифметический способ: , при n≤30, p=1
, при n>30, p>1
d – отклонение каждой варианты от средней вариационного ряда, d=V-М.
Способ моментов: (таблица 2).
При вычислении среднего квадратического отклонения может быть использован и приближенный способ по амплитуде вариационного ряда: , где Vmax – величина наибольшей варианты вариационного ряда; Vmin – величина наименьшей варианты вариационного ряда; Vmax–Vmin = Am – амплитуда вариационного ряда; k – коэффициент, определяемый по специальной вспомогательной таблице 3, исчисленной С.И. Ермолаевым.
Таблица 3
Таблица значений k (по С.И. Ермолаеву)
–
–
1,13
1,69
2,06
2,33
2,53
2,70
2,85
2,97
3,08
3,17
3,26
3,34
3,41
3,47
3,53
3,59
3,64
3,69
3,73
3,78
3,82
3,86
3,90
3,93
3,96
4,00
4,03
4,06
4,09
4,11
4,14
4,16
4,19
4,21
4,24
4,26
4,28
4,30
4,32
4,34
4,36
4,38
4,40
4,42
4,43
4,45
4,47
4,48
4,50
4,51
4,53
4,54
4,56
4,57
4,59
4,60
4,61
4,63
4,64
4,65
4,66
4,68
4,69
4,70
4,71
4,72
4,73
4,74
4,75
4,77
4,78
4,79
4,80
4,81
4,82
4,83
4,83
4,84
4,85
4,86
4,87
4,88
4,89
4,90
4,91
4,91
4,92
4,93
4,94
4,95
4,96
4,99
4,97
4,98
4,99
4,99
5,00
5,01
К
5,02
5,49
5,76
5,94
6,07
6,18
6,28
6,35
6,42
6,48
Еще один часто применяемый метод расчета среднего квадратического отклонения при небольшом числе наблюдений по формуле Пирсона: σ =Am*K, где Am – амплитуда вариационного ряда, К – коэффициент Пирсона, находится по таблице 4.
Таблица 4
Таблица коэффициентов Пирсона
n
К
0,89
0,49
0,39
0,35
0,32
0,27
0,24
0,23
0,22
Среднее квадратическое отклонение оценивает степень вариабельности вариационного ряда прямо пропорционально: чем больше σ, тем вариационный ряд более разнообразен и выборочная статистическая совокупность, из которой он сформирован, более неоднородна, и наоборот, чем меньше σ, тем вариационный ряд менее вариабелен и выборочная статистическая совокупность неоднородна в меньшей степени.
Для сравнения разнообразия двух средних величин, выраженных в различных единицах измерения или имеющих различия в величине признаков, используется относительная величина, коэффициент вариации (CV), выпаженный в процентах:
,
Если CV>20%, то имеет место сильное разнообразие вариационного ряда; CV от 10 до 20% – среднее разнообразие; CV < 10% – слабое разнообразие вариационного ряда.
При необходимости оценить симметричность вариационного ряда рассчитывается коэффициент асимметрии (Ка):
, где Мо – мода, наиболее часто встречающаяся варианта.
Коэффициент асимметрии колеблется от –3 до +3. Если Ка<0, то асимметрия отрицательная, левосторонняя; если Ка>0, то асимметория положительная, правосторонняя; когда Ка=0, ряд симметричен.