Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Между двумя признаками



Простейшим приемом обнаружения связи является сопоставление ряда значений факторного признака и соответствующего ему ряда значений результативного признака.

Если при возрастании величины факторного признака наблюдается рост результативного признака, то говорят о возможном наличии прямой корреляционной связи. Если с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную корреляционную связь между признаками.

Между криминогенными факторами и преступностью существует прямая корреляционная связь. Например, чем выше уровень алкоголизации в обществе, тем выше преступность. Между факторами антикриминогенными и преступностью действует обратная корреляционная зависимость. Например, чем выше социальный контроль в обществе, тем ниже преступность.

И прямые, и обратные связи могут быть линейными и криволинейными. В случае линейной связи аналитическое выражение связи между признаками имеет вид линейной регрессии, а при криволинейной связи – нелинейной регрессии (параболической, гиперболической и т.д.).

Примером криволинейной связи может служить связь преступности и возраста правонарушителей. Вначале криминальная активность растет с увеличением возраста правонарушителей (примерно до 30 лет), а затем с увеличением возраста преступная активность снижается.

Пусть имеем два ряда наблюдений величин X и Y. Если пары наблюдаемых значений (xi, yi) встречаются по одному разу, то их записывают в виде табл. 9.1.

Таблица 9.1

i n
xi x1 x2 xn
yi y1 y2 yn

 

Здесь i – номер наблюдения.

Если каждому значению yi соответствуют несколько значений X, а каждому значению xi – несколько значений Y, то данные записывают в виде табл. 9.2.

Таблица 9.2

Y X y1 y2 ym
x1 n11 n12 n1m
x2 n21 n22 n2m
xk nk1 nk2 nkm

Здесь числа nij – частоты, показывающие, сколько раз повторяются парные значения (xi, yi). Например, n24 показывает, сколько раз произошло событие, состоящее в том, что X = x2 и Y = y4.

Последняя таблица, в которой результаты наблюдений записаны в порядке возрастания X и Y, называется корреляционной таблицей.

В отличие от функциональной связи между признаками здесь нет строго соответствия между X и Y, но можно найти соответствие между значениями одной и средним значением другой величины.

Если X и Y (X или Y) имеют большое количество значений, то можно осуществлять группировку признаков. Для этого разность между максимальным и минимальным значениями признака (xmaxxmin или уmaxуmin) делится на число групп. В результате находим величину интервала, а затем определяем центральные значения интервалов.

Для определения числа групп l можно воспользоваться формулой Стэрджесса

l = 1,322 lg n,

где n – общее число наблюдаемых значений признака.

Предположим, что имеем два статистических ряда, характеризующих за 20 лет количество административных проступков (X) и преступлений (Y), совершенных на крупном предприятии.

Таблица9.3

i Число административных правонарушений (хi) Число преступлений (уi)

 

Установим наличие или отсутствие корреляционной связи между факторным признаком X и результативным признаком Y.

В таблице данные расположены не хронологически, а в порядке возрастания числа административных правонарушений.

Можно видеть, что в целом с возрастанием числа правонарушений наблюдается и рост числа преступлений, хотя в отдельных случаях такая зависимость не усматривается.

Большое число различных значений факторного признака X затрудняет восприятие представленных рядов значений. Проведем группировку значений X. При этом группировку значений результативного признака Y проводить не будем, так как имеем всего пять различных значений Y.

Для признака X определим величину интервала h:

,

где xmaxxmin = 120 - 72 = 48.

По формуле Стэрджесса находим

l = 1,322 lg 20 ≈ 5.

Таким образом, .

Построим корреляционную таблицу, в которой добавим столбец с центральными значениями интервалов.

Таблица 9.4

Центральное значение интервала  
76,5 72-81      
86,5 82-91  
96,5 92-101  
106,5 102-111      
112-120      

 

Если частоты в корреляционной таблице расположены по диагонали из левого верхнего угла таблицы в правый нижний (как в примере), то можно предположить наличие прямой корреляционной зависимости между X и Y. Если частоты расположены по другой диагонали, то можно предположить обратную связь между признаками.

Для предварительного выявления наличия связи и раскрытия ее характера применяют графический метод. В прямоугольных координатах X, Y строят точечный график, который называют полем корреляции.

Нанесем на поле корреляции средние значения для каждого значения уi. Соединяя эти значения отрезками прямых, получим эмпирическую линию связи. По виду ломаной выясняем вид корреляционной связи (линейная, криволинейная). Исходя из этого строим ту или иную регрессионную модель, то есть строим уравнение (или ), которое называется уравнением регрессии Y на X (или уравнением регрессии X на Y). Эти уравнения определяют теоретические линии регрессии.

Анализ поля корреляции и эмпирической лини связи для рассматриваемого примера показывает, что между X и Y существует прямая и линейная корреляционная связь.

 

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.