Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

В зависимости от того, какие значения может потенциально принимать переменная, выделяют два типа количественных данных: дискретные и непрерывные



Дискретная - это такая переменная, которая может принимать значения только из некоторого списка определенных чисел. Примерами дискретной переменной являются число детей в семье; число вызовов "скорой помощи", поступающих в больницу; число отказов изделия; число клиентов, обратившихся в фирму за определенный промежуток времени, и т. д.

Непрерывной будем считать любую переменную, не являющуюся дискретной. Она принимает значения из некоторого промежутка. Примерами непрерывной переменной является рост взрослого человека (например от 140 до 230 см), фактическая масса буханки хлеба (например от 750 до 830 г), дальность полета снаряда, урожайность культуры, выращенной в хозяйстве и т. п.

Есть данные, которые регистрируют определенное качество, которым обладает объект. Такие данные называют качественными. Даже если значениям этого качества можно приписать числа (например, полу человека приписать соответственно числа 0 и 1), то обрабатывать эти числа как количественные данные нельзя. Примерами качественных данных являются тип школы, где обучается ребенок (лицей, гимназия, специализированная физико-математическая школа); должность, которую занимает сотрудник на предприятии; названия газет, которые читают в определенном городе, и т. п.

Качественные данные бывают двух типов: порядковые, для которых существует имеющий содержательный смысл порядок, и номинальные, для которых нет содержательно интерпретируемого порядка.

Порядковые данные можно ранжировать и использовать это ранжирование при проведении статистического анализа. Примером порядковых данных являются ответы на вопросы анкеты, содержащей следующие варианты ответов: да; больше да, чем нет; больше нет, чем да; нет. Хоть и можно выразить эти ответы числами (например, 4, 3, 2, 1), но предложенная шкала оценок носит субъективный характер. Нельзя считать, что разница между ответами 4 и 3 такая же, как и между ответами 2 и 1. Также нельзя считать, что ответ 3 в три раза лучше ответа 1.

Для номинальных данных нет числовых значений и нет основы для ранжирования. Примерами номинальных данных являются регионы России, из которых приехали студенты МГУ; названия фирм, изготавливающих моющие средства; пол работников фирмы.

Если порядок записи значений данных во времени имеет содержательный смысл, то говорят, что эти данные представляют собой временной ряд. Эти данные представляют информацию об объекте в различные моменты времени. Если порядок записи данных во времени не существенен, то говорят об одном временном срезе. Эти данные представляют информацию об объектах в определенный момент времени. Примерами временного ряда являются данные о преступности в регионе за несколько лет; об уровне безработицы за несколько лет; динамика успешности учащихся по математике и т. п. Примерами одного временного среза являются данные о числе преступлений в районах области в определенный год; число безработных среди различных возрастных групп населения по данным на определенный день; данные о выполнении текста учащимися класса и т. п.

Иногда данные класифицируют также по тому, собирались ли они специально для запланированного анализа или собирались ранее для других нужд. В первом случае их называют первичными данными, а во втором - вторичными данными. Получение первичных данных сопряжено зачастую с большими затратами средств и времени, но зато исследователь получает то, что ему нужно. Вторичные данные, как правило, обходятся дешевле, их быстрее можно получить, но при этом не всегда в них можно найти то, что нужно.

Многие статистические данные получают в процессе измерений. Целью измерений является получение информации о признаках объектов, организмов, событий. Измеряется не сам объект, а только свойства или отличительные признаки объекта. Например, измеряется не ученик, а его рост, масса, его скорость чтения, достижения по математике, спортивные достижения и т. п. Измерения осуществляются путем установления соответствия между числами и объектами, которые являются носителями подлежащих измерению свойств. Измерения могут проводиться на разных уровнях. Различным уровням измерений соответствуют различные шкалы:

1) номинальная шкала;

2) порядковая, или ранговая, шкала;

3) шкала интервалов;

4) шкала отношений, или шкала пропорций;

5) логарифмическая шкала.

Номинальная шкала используется для регистрации самого низшего уровня измерений, предполагающего наличие минимальных предпосылок для измерения. При измерениях на данном уровне практически не используются числа. Здесь важно установить подобие или различие объектов по некоторому признаку, т. е. при этом имеют дело с качественными данными. Рассмотрим примеры.

- Распределения учащихся по классам, по половому признаку, по месту жительства, по видам спорта, которыми они занимаются, по числу детей в семье являются примерами величин номинальной шкалы. При этом возможно распределение учащихся по двум или более признакам (двумерные или многомерные данные).

- Перечень фирм, занимающихся производством грузовых и легковых автомобилей, автомобилей специального назначения, автобусов; отличительные признаки автомобилей являются примерами величин номинальной шкалы.

С помощью подсчета можно установить частоту той или иной категории (число мальчиков и девочек в школе; число учащихся, проживающих в каждом микрорайоне; число учащихся в каждом классе; число учащихся, занимающихся тем или иным видом спорта; количество фирм, занимающихся производством автобусов и т. д.). При этом можно определить наиболее часто встречающуюся величину (класс, в котором учится наибольшее число учащихся; вид спорта, пользующийся наибольшей популярностью у учащихся; тип автомобиля, производством которого занимается наибольшее число фирм). Категории данных номинальной шкалы обозначаются, как правило, словесно (вербально).

Порядковая, или ранговая, шкала указывает лишь последовательность носителей признака или направление степени выраженности признака.

Например, учащихся можно ранжировать по количеству правильно выполненных тестовых заданий. Пусть учащиеся А, Б, В, Г, Д правильно выполнили соответственно 21, 16, 12, 9 и 3 задания. Графически это можно изобразить так:

Эта порядковая шкала имеет величины от 1 до 5, и учащиеся на ней размещены в зависимости от количества правильно выполненных заданий: А - первый, Д - пятый. Из рисунка видно, что интервалы, разделяющие места в ряду, различны по величине. По этой причине нецелесообразно складывать, вычитать, умножать и делить порядковые места.

Шкала школьных оценок по одному предмету является порядковой шкалой, так как интервалы между отдельными баллами не отражают разрыва между реальными результатами. Мы знаем только, что ученик, получивший оценку "5" по какому-то предмету, знает этот предмет лучше того, кто получил "4". Но нельзя утверждать, что различие в знаниях этих учащихся такое же, как и в знаниях тех, кто получил "4" и "3". Так как шкала оценок является порядковой шкалой, то некорректно выставлять итоговую оценку как среднюю арифметическую текущих оценок.

Другим примером порядковой шкалы является шкала должностей, которые занимают работники на предприятии: директор, заместитель директора, начальник отдела, заведующий лабораторией, старший инженер, инженер, младший инженер, техник, старший лаборант, лаборант.

На шкале интервалов равные интервалы отображают одинаковую меру величины измеряемого признака. Например, 1 см между 3-м и 4-м сантиметрами на шкале измерений длин имеет такой же смысл, как и 1 см между 82-м и 83-м сантиметрами. Другими словами, на шкале интервалов расстояния между соседними делениями равны. На интервальной шкале вполне осмысленным является вопрос "на сколько?". Но не всегда, пользуясь интервальной шкалой, можно формулировать вопрос "во сколько раз?". Дело в том, что на шкале интервалов устанавливаются произвольно начало отсчета (нуль шкалы), единица измерения и направление отсчета. Примером интервальной шкалы является температурная шкала по Цельсию. Разность между температурами воздуха +30 и +20 °С столь же велика, как и между -10 и -20 °С. Однако нельзя утверждать, что при температуре воздуха +30 °С в полтора раза теплее, чем при температуре +20 °С. Даже если температура воздуха равна 0 °С, нельзя утверждать, что тепла нет совсем: ведь начало отсчета выбрано произвольно.

Шкалы на большинстве физических приборов (амперметр, вольтметр и др.) являются интервальными. Шкала коэффициента интеллекта IQ является шкалой интервалов.

Шкала интервалов является метрической, с ее помощью можно выполнять сложение и вычитание. Она имеет значительные преимущества по сравнению с номинальной и порядковой шкалами.

Шкала отношений, или шкала пропорций, дает возможность устанавливать отношения значений измеряемого признака благодаря тому, что значению шкалы "0" соответствует величина, для которой измеряемый признак отсутствует. Другими словами, начало отсчета на этих шкалах выбирают непроизвольно. Примерами шкалы отношений являются меры длины (м, см и т. д.) и массы (кг, г и т. д.). Предмет длиной 100 см вдвое длиннее предмета длиной 50 см.

Иногда данные нуждаются в преобразованиях. В частности, потребность в этом возникает, когда в ряду данных одно или несколько данных существенно превышают остальные. Если данные явно несимметричны, то заменяют каждое значение приведенного набора данных логарифмом этого значения с целью упростить статистический анализ. Логарифмирование преобразует "скошенные" (ассимметричные) данные в более симметричные, так как происходит "растягивание" шкалы возле нуля, малые значения, сгруппированные вместе, распределяются вдоль шкалы. В то же время логарифмирование собирает вместе большие значения на правом конце шкалы. Наиболее часто применяют десятичные и натуральные логарифмы. Равным расстояниям на логарифмической шкале соответствует на исходной шкале равные процентные увеличения, а не равные увеличения значений.

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.