Статистическая информация – это числовые данные о массовых явлениях, это значения наблюдаемых признаков объектов, составляющих статистическую совокупность, которые получены в результате статистического наблюдения. Таким образом, источником статистической информации является реальный опыт, эксперимент, наблюдение, измерение, производимые над реальными объектами и явлениями окружающего нас мира. Этим статистика отличается от теории вероятностей, которая имеет дело лишь с мысленными (воображаемыми) экспериментами. Кроме того, статистика изучает не только случайные явления, но и не случайные (детерминированные) этим статистика также отличается от теории вероятностей. Однако независимо от того, случайные или не случайные явления изучает статистика, важнейшим методом исследования явлений является выборочный метод, основанный на теории вероятностей. Поэтому математическая статистика и теория вероятностей тесно связаны между собой и между ними нет четкой границы.
В настоящее время под термином "статистические данные" понимают все собранные сведения, которые в дальнейшем подвергаются статистической обработке. В различной литературе их еще называют: переменные, варианты, величины, даты и т.д. Все статистические данные можно разделить на: качественные, труднодоступные для измерения (имеется, не имеется; больше, меньше; сильно, слабо; красный, черный; мужской, женский и т.д.), и количественные, которые можно измерить и представить в виде числа общих мер (2 кг, 3 м, 10 раз, 15 с и т.д.); точные, величина или качество которых не вызывают сомнений (в группе 6 человек, 5 столов, деревянный, металлический, мужской, женский и т.д.), и приближенные, величина или качество которых вызывает сомнение (все измерения: рост 170 см, вес 56 кг, результат бега на 100 м - 10,3 с и т.д.; близкие понятия — синий, голубой, мокрый, влажный и т.д.); определенные (детерминированные), причины появления, не появления или изменения которых известны (2 + 3 = 5, подброшенный вверх камень обязательно будет иметь вертикальную скорость, равную 0 и т.д.), и случайные, которые могут появляться и не появляться или не все причины изменения которых известны (пойдет дождь или нет, родится девочка или мальчик, команда выиграет или нет, в беге на 100 м — 12,2 с, принятая нагрузка вредна или нет). В большинстве случаев в статистике мы имеем дело с приближенными случайными данными.
Статистические данные могут быть представлены в различных формах. На практике используют следующие формы представления статистических данных:
а) текстовую;
б) табличную;
в) вариационный ряд;
г) графическую.
Простейшей из них является запись результатов в порядке их получения – запись в ряд: называемый простым статистическим рядом, или выборкой. Отдельные значения выборки – варианты или данные наблюдений. Количество вариант в ряду – объем ряда или выборки.
Запись статистической информации в форме простого ряда имеет два существенных недостатка: труднообозримость (особенно при большом объеме выборки) и громоздкость. Например, игральный кубик бросили 15 раз и записали выпавшие числа в порядке их появления: 3,5,3,5,6,1,5,6,4,1,2,3,5,6,4 (n=15)
Первый недостаток можно устранить упорядочиванием данных, расположив их в порядке возрастания или убывания. Например, 1,1,2,3,3,3,4,4,5,5,5,5,6,6,6.
Второй недостаток можно устранить, записав данные в виде таблицы, где в первом ряду записаны только значения встречающихся вариант по одному разу, а под каждым значением ni – частоту варианты, то есть число, показывающее сколько раз каждое значение встречается в ряду.
xi
ni
Если вместо ni указывать относительные частоты ,то можно составить вариационный ряд относительных частот. Для нашего примера:
xi
wi
0.133
0.067
0.2
0.133
0.267
0.2
Таким образом, выборки по одному признаку можно задавать тремя способами:
а) с помощью простого вариационного ряда;
б) с помощью вариационного ряда частот;
в) с помощью вариационного ряда относительных частот.
Статистический ряд распределения представляет собой упорядоченное распределение единиц изучаемой совокупности по определенному варьирующему признаку. Он характеризует структуру исследуемого явления, позволяет судить об однородности совокупности, границах ее изменения, закономерностях развития наблюдаемого объекта. Построение рядов распределения является составной частью сводной обработки статистической информации.
В зависимости от признака, положенного в основу образования ряда распределения, различают атрибутивные (качественные) и вариационные (количественные) ряды распределения. Вариационные в зависимости от характера вариации признака делятся на дискретные и интервальные ряды распределения.
Процесс группировки в интервальный ряд, как правило, состоит из 4-х шагов.
1 шаг состоит в определении числа интервалов, при этом можно пользоваться следующей таблицей