Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Стандартное отклонение

⇐ ПредыдущаяСтр 2 из 6Следующая ⇒

Стандартное отклонение — это число, описывающее, насколько значения данных обычно отличаются от среднего. Понятие стандартного отклонения является очень важным в статистике, поскольку оно представляют собой основной инструмент определения степени случайности в изучаемой ситуации. В частности, этот показатель является мерой случайности отклонений отдельных значений от их среднего.

Если все величины одинаковы, как, например, в приведенном ниже простом наборе данных

5,5; 5,5; 5,5; 5,5

то среднее будет иметь значение = 5,5, а стандартное отклонение составит S = 0. Последнее отражает тот факт, что в этом тривиальном наборе данные не подвержены изменчивости.

В реальной жизни большинство данных характеризуется большей или меньшей степенью изменчивости. Отдельные значения набора данных располагается на некотором расстоянии от среднего, а стандартное отклонение характеризует степень изменчивости. Рассмотрим теперь другой набор данных, которым присуща некоторая изменчивость:

43,0; 17,7; 8,7; -47,4

Эти числа являются значениями ставки доходности (например, 43%) акций четырех компаний (Maytag, Boston Scientific, Catalytica и Mitcham Industries), выбранных случайным образом (случайность обеспечивалась путем метания стрелы игры дарт в газетную страницу с котировками акций). Среднее значение в этом случае такое же, = 5,5, т.е. эти акции имеют среднюю ставку доходности 5,5% (это означает, что портфель равных в денежном выражении инвестиций в названные выше акции будет иметь эту среднюю доходность 5,5%). Несмотря на то, что среднее значение здесь такое же, как и в предыдущем случае, отдельные значения данных существенно различаются между собой. Первая величина, 43,0, располагается на расстоянии X₁- = 43,0 - 5,5 = 37,5 от среднего значения. Из этого следует, что ставка доходности акций Maytag превышает среднюю ставку доходности на 37,5%. Последнее значение, -47,4, расположено от среднего на расстоянии X₄- = -47,4 - 5,5 = -52,9; таким образом, ставка доходности акций Mitcham Industries оказывается на 52,9% ниже среднего уровня (ниже — поскольку величина отрицательна). В табл. 5.1.1 показано, насколько каждое из значений отличается от среднего.

Таблица 5.1.1

Фирма	Значение	Отклонение
Maytag Boston Scientific Catalytica Mitcham Industries	43,0 17,7 8,7 -47,4	37,5 12,2 3,2 -52,9

Описанные выше расстояния от среднего значения называются отклонением, или разностью. Они показывают, насколько выше среднего значения (в случае положительной разности) или ниже среднего (если разность отрицательна) лежит каждое значение данных. Отклонения в свою очередь образуют набор данных, расположенных вокруг нуля, что похоже на исходный набор данных, значения в котором расположены вокруг среднего.

В качестве обобщающей характеристики отклонений используют стандартное отклонение. Просто усреднить отклонения нельзя, поскольку часть из них окажется отрицательными, а часть — положительными, в результате чего результат такого усреднения всегда будет равен нулю и не будет содержать никакой дополнительной информации. Вместо этого используют стандартный прием, заключающийся в том, что каждое значение сначала возводят в квадрат, чтобы избавиться от знака “минус”, затем складывают, делят на n-1 и извлекают квадратный корень (это обратная операция по отношению к выполненному ранее возведению в квадрат).

Путем алгебраических преобразований можно показать, что сумма отклонений от среднего для любого набора данных всегда будет равна нулю. Казалось бы, следует просто заменить знаки «минус» на «плюс» и затем провести усреднение. Однако несложно также показать, что такой простой метод не обеспечивает эффективного использования всей содержащейся в данных информации, если речь идет о нормальном распределении.

Деление на n-1 вместо n (как это обычно делают при вычислении среднего значения) связано с поправкой, обусловленной тем фактом, что при работе с выборкой истинное значение среднего генеральной совокупности неизвестно. Можно также считать, что эта поправка обусловлена потерей при вычислении отклонений одной порции информации (или, как говорят в статистике, одной степени свободы). Потерянной является информация об истинных значениях данных (поскольку теперь, при работе с отклонениями, данные расположены не вокруг среднего, а вокруг нуля).

⇐ Предыдущая 123 4 5 6 Следующая ⇒

Поиск по сайту: