Под выборочным наблюдением понимается такое несплошное наблюдение, при котором статистическому наблюдению подвергаются единицы изучаемой совокупности, отобранные случайным способом. Выборочное наблюдение ставит перед собой задачу — по обследуемой части дать характеристику всей (генеральной) совокупности единиц. Совокупность отобранных для обследования единиц называют выборочной, а совокупность единиц, из которых производится отбор, — генеральной.
Отбор единиц в выборочную совокупность может быть повторным или бесповторным.
При повторном отборе попавшая в выборку единица подвергается обследованию, т. е. регистрации значений ее признаков, возвращается в генеральную совокупность и наравне с другими единицами участвует в дальнейшей процедуре отбора. Таким образом, некоторые единицы могут попадать в выборку дважды, трижды или даже большее число раз. И при изучении выборочной совокупности они будут рассматриваться как отдельные независимые наблюдения.
При бесповторном отборе попавшая в выборку единица подвергается обследованию и в дальнейшей процедуре отбора не участвует. Такой отбор целесообразен и практически возможен в тех случаях, когда объем генеральной совокупности четко определен. Получаемые при этом результаты, как правило, являются более точными по сравнению с результатами, основанными на повторной выборке.
Выборочное наблюдение всегда связано с определенными ошибками получаемых характеристик. Эти ошибки называются ошибками репрезентативности (представительности).
Ошибки репрезентативности обусловлены тем обстоятельством, что выборочная совокупность не может по всем параметрам в точности воспроизвести совокупность генеральную. Получаемые расхождения или ошибки репрезентативности позволяют заключить, в какой степени попавшие в выборку единицы могут представлять всю генеральную совокупность. При этом следует различать систематические и случайные ошибки репрезентативности.
Систематические ошибки репрезентативности обусловлены нарушением принципа случайности отбора (тенденциозный отбор) и являются однонаправленными ошибками. Их можно устранить правильной процедурой отбора единиц в выборку.
Случайные ошибки репрезентативности обусловлены действием случайных факторов, не содержащих каких-либо элементов системности. Но даже при строгом соблюдении всех принципов формирования выборочной совокупности выборочные и генеральные характеристики будут несколько различаться. Получаемые случайные ошибки могут быть статистически оценены и учтены при распространении результатов выборочного наблюдения на всю генеральную совокупность. Оценка ошибок выборочного наблюдения основана на теоремах теории вероятностей.
Выборка характеризуется следующими показателями:
средняя ошибка выборки (повторный отбор):
средняя ошибка выборки (бесповторный отбор):
предельная ошибка выборки — ошибка, исчисленная с заданной степенью вероятности:
где s2 — выборочная дисперсия (значения признака или доли),
n — объем выборочной совокупности;
N — объем (число единиц) генеральной совокупности;
– выборочная дисперсия значения признака (х);
– выборочная дисперсия доли;
ω — выборочная доля ( ), т.е. доля единиц, обладающих определенным вариантом или вариантами изучаемого признака, в выборочной совокупности ;
— выборочная средняя;
t — коэффициент доверия (табличное значение).
Предельная ошибка выборки дает возможность выяснить, в каких пределах находится величина генеральной средней с учетом заданной вероятности;
На величину вероятности указывает множитель t. Обычно используются нормированные (табличные) значения t, для определенных значений вероятности Ф(t):
t=1
Ф(t)= 0,683
t=2
Ф(t)= 0,954
t=3
Ф(t)= 0,997
Зная выборочную среднюю величину признака ( ) и предельную ошибку выборки (Dx), можно определить границы (пределы), в которых заключена генеральная средняя ( ):
или
Зная выборочную долю признака ( ) и предельную ошибку выборки ( ), можно определить границы, в которых заключена генеральная доля (р):
Для типической выборки при расчете средней ошибки (m) используют не общую дисперсию, а среднюю из внутригрупповых дисперсий ( ), при серийной выборке — межгрупповую дисперсию (d2).
Для определения необходимой численности выборки исследователь должен задать уровень точности (предельную ошибку) выборочной совокупности с определенной вероятностью.
Численность случайной повторной выборки определяется по формуле:
, или
бесповторной:
.
где или — относительная ошибка выборки
— коэффициент вариации
Если расчет проводится по качественному альтернативному признаку и не известна его доля в генеральной совокупности, её принимают равной 0,5, так как дисперсия доли достигает максимума: = 0,25 при ω = 0,5.
Пример 9.1. Для определения качества партии товара 5% от всего количества изделий были подвергнуты выборочному обследованию. Из 1000 проверенных изделий 150 были нестандартными. Определить с вероятностью 0,954 долю нестандартных изделий во всей партии.
Решение: По условию задачи дано:
= 5% или 0,05
Определим долю нестандартных изделий в выборочной совокупности:
Доля нестандартных изделий во всей партии будет находиться в пределах от 12,8 до 17,2% при вероятности 0,954.
Пример 9.2. Для определения среднего срока пользования краткосрочным кредитом в банке была произведена 10%-ная механическая выборка, в которую попало 200 счетов. В результате обследования установлено, что средний срок пользования краткосрочным кредитом – 30 дней при среднем квадратическом отклонении 9 дней. С вероятностью 0,997 определить пределы, в которых будет находиться средний срок пользования краткосрочным кредитом в генеральной совокупности.
Решение. Средний срок пользования кредитом в банке находится в пределах:
– Δх + Δх .
Так как выборка механическая, то ошибка выборочного наблюдения определяется по формуле:
Δх = t ;
Δх = 3 = 1,81 2 дня
=30 дн. 2 дн. или 30 дн.–2 дн. 30 дн.+2 дн.
С вероятностью 0,997 можно утверждать, что средний срок пользования краткосрочным кредитом в банке находится в пределах от 28 дней до 32 дней.