Среднее количество наступлений события в случае биномиального распределения выражается формулой Е(Х) = nπ, т.е. вычисляется как произведение количества возможностей реализации события на вероятность наступления события. Среднее для доли
Е = Е(р) = π
равно вероятности наступления события.
Можно воспринимать Х/n как относительную частоту события. Тот факт, что Е(Х/n) = π , свидетельствует, что усредненная относительная частота события равна вероятности этого события.
Этого и следовало ожидать. Например, если опрошена выборка из 200 избирателей и для каждого из них вероятность отдать предпочтение вашему кандидату равна 58%, то в среднем следует ожидать, что
Е = Е(р) = π = 0,58,
или 58%, опрощенных избирателей отдадут предпочтение вашему кандидату. Если говорить о количестве опрошенных, следует ожидать, что Е(Х) = n π = 200 * 0,58 = 116 человек из 200 попавших в данную выборку отдадут предпочтение этому кандидату. Конечно, реальное количество и процент будут случайным образом отличаться от этих ожидаемых значений.
Существуют также формулы для вычисления стандартного отклонения имеющей биномиальное распределение величины и для вычисления процентной доли. Они приведены с формулой для вычисления ожидаемого значения ниже.
В рассмотренном выше примере о приеме заказов по телефону n=3 и π = 0,60. Если воспользоваться приведенными выше формулами, среднее значение и стандартное отклонение можно найти следующим образом.
Таким образом, следует ожидать, что 1,80 из этих 3 телефонных звонков приведут к получению заказов. В некоторых случаях большее (например, 2 или 3) или меньшее (например, 0 или 1) количество звонков приведут к получению заказа. Величина этой неопределенности определяется, как обычно, стандартным отклонением, составляющим для данного примера 0,849 звонка. Ожидается также, что 60% из этих трех звонков приведут к получению заказов. Последнее, число, 28,3%, означающее стандартное отклонение для процента, интерпретируется не как процент от некоторого количества, а как процентные единицы. Это означает, что если мы ожидаем 60%, то реально мы можем наблюдать на 28,8 процентных единиц больше (т.е. 60 + 28,3 = 88,3%) или ниже (т.е. 60 - 28,3 = 31,7%) этого значения. Это естественно, поскольку, как известно, стандартное отклонение выражается в тех же единицах, что и данные, а в случае процентной доли р стандартное отклонение выражается именно в процентных единицах (т.е. собственно в процентах).
Пример. Запоминание рекламы
Предположим, что ваша организация собирается заключить контракт с фирмой, специализирующейся на маркетинговых исследованиях для изучения воздействия вашей рекламы на жителей Америки. В определенный день отобранные люди должны прийти и просмотреть телепрограммы с рекламой многих товаров различных компаний. На следующий день эти люди придут еще раз, чтобы ответить на ряд вопросов. В частности, планируется определять уровень запоминания, который вычисляется как процент людей, которые вспомнят рекламу вашей фирмы на следующий день после просмотра.
До заключения контракта на проведение этой работы необходимо оценить, насколько достоверными и точными будут полученные результаты. Средства, выделяемые вашей фирмой на исследование рекламы, дают возможность пригласить для участия в исследовании 50 человек. В результате обсуждения с представителями фирмы стало известно, что есть смысл предположить, что 35% участников будут помнить рекламу; однако точная доля, естественно, неизвестна. Насколько точными будут результаты исследования, если исходить из предположения, что доля таких людей действительно составит 35%? Это означает: насколько будет отличаться полученный в результате опроса процент людей, запомнивших рекламу, от предполагаемого значения π = 0,35 при n = 50 и биномиальном распределении результатов? Ответ находим, вычисляя соответствующее стандартное отклонение:
σр = = = 0,0675 или 6,75%
Это означает, что полученный при проверке запоминания результат (процент участвующих в исследовании людей, которые запомнят рекламу) будет, скорее всего, отличаться от истинного значения процентной доли для всего населения примерно на 7% в любую (в большую или в меньшую) сторону.
Однако ваша фирма считает, что необходимо получить более точные результаты. Повысить точность результатов можно за счет сбора большего объема информации, для чего необходимо увеличить размер выборки n. В результате проверки бюджета исследования и обсуждения затрат установлено, что можно привлечь к исследованию n = 150 человек. Для такой большей выборки стандартное отклонение уменьшится:
σр = = 0,0389 или 3,89%
Кажется странным, что увеличение затрат не привело к значительному улучшению результата. При увеличении размера исследования в три раза точность не возросла даже вдвое! Это связано с тем, что в формулу входит не сама величина п, а квадратный корень из n. Однако, несмотря на это, фирма решает пойти на дополнительные затраты, считая, что достигнутая дополнительная точность стоит того.