Помощничек
Главная | Обратная связь


Археология
Архитектура
Астрономия
Аудит
Биология
Ботаника
Бухгалтерский учёт
Войное дело
Генетика
География
Геология
Дизайн
Искусство
История
Кино
Кулинария
Культура
Литература
Математика
Медицина
Металлургия
Мифология
Музыка
Психология
Религия
Спорт
Строительство
Техника
Транспорт
Туризм
Усадьба
Физика
Фотография
Химия
Экология
Электричество
Электроника
Энергетика

Выявление наличия корреляционной связи



Для установления факта наличия корреляционной связи факторного и результативного признаков используются методы:

§ сопоставления рядов значений признаков X и Y;

§ графического представления взаимосвязи признаков;

§ корреляционных таблиц;

§ аналитической группировки.

 

Ø Метод сопоставления взаимосвязанных параллельных рядов является простейшим приемом обнаружения связи между признаками.

Метод заключается в выявлении статистической связи признаков путем простого параллельного сравнения факторных и результативных значений у отдельных единиц совокупности. Для этого значения x1, x2, …, xn фактора X ранжируется, т.е. располагаются в порядке возрастания (или убывания). Затем строится ряд соответствующих значений результативного признака Y, и путем сопоставления двух построенных рядов выявляется либо наличие (и направление) связи, либо ее отсутствие. Если, например, с возрастанием значений признака X значения признака Y также в целом возрастают при наличии некоторых отклонений от этой общей тенденции, то между признаками X и Y возможно наличие прямой корреляционной связи. Такое заключение имеет место, например, для табл.4 с ранжированными факторными значениями (построенной по данным табл.1).

Таблица 4.

Взаимосвязанные параллельные ряды

xi
yi

 

К недостаткам метода следует отнести прежде всего невозможность определения количественной меры связи между изучаемыми признаками. Кроме того, при большом числе различных значений yi, соответствующих одному и тому же значению xi, восприятие таких параллельных рядов затруднительно, особенно для больших по объему статистических совокупностей. В таких случаях для выявления наличия связи признаков целесообразно пользоваться статистическими таблицами - аналитическими или корреляционными.

Ø При выявлении наличия связи методом аналитической группировки формируется группировка единиц совокупности по факторному признаку X, а затем для каждой выделенной j-ой группы рассчитываются средние значения результативного признака Y. Если при переходе от одной группы к другой средние значения будут изменяться с определенной закономерностью – возрастать или убывать, то между признаками Х и Y существует корреляционная связь (как, например, в табл.3).

Таблица 3

Зависимость выпуска продукции от среднегодовой стоимости

основных производственных фондов

Номер группы Группы предприятий по стоимости основных фондов, млн.руб Число предприятий Выпуск продукции, млн.руб.
Всего по группе В среднем на одно предприятие,
94,00 - 134,80 331,00 110,33
134,80 - 175,60 887,00 110,88
175,60 - 216,40 1461,00 146,10
216,40 - 257,20 824,00 164,80
257,20 - 298,00 806,00 201,50
Итого   4309,00 143,63

 

 

Ø При использовании метода корреляционных таблиц, охватывающих два интервальных ряда распределения - факторного и результативного признаков, прослеживают визуально, как именно расположена в таблице основная масса частот повторения в эмпирических данных сочетаний (xi, yj). Концентрация частот вдоль диагонали от левого верхнего угла таблицы к правому нижнему (т.е. большему значению X соответствует большее значение Y) означает наличие прямой корреляционной связи между признаками (как, например, в табл. 5, 6, построенных по данным табл. 2 и 3 соответственно ). Если же частоты концентрируются около диагонали от левого нижнего угла к правому верхнему (когда большему значению Х соответствует меньшее значение Y), то связь между признаками X и Y обратная.

Интенсивная концентрация частот около диагонали таблицы указывает на факт тесной корреляционной связи. Так, в корреляционной табл.5, 6 наблюдается тесная связь между среднегодовой стоимостью основных производственных фондов и выпуском продукции.

Корреляционная таблица дает более правильную характеристику тесноты связи в случае, если число выделенных групп одинаково для обоих изучаемым признаков X и Y (табл. 5, 6).

Таблица 5

Корреляционная таблица взаимосвязи признаков

Y Х nx
     
   
     
     
ny

 

 

Таблица 6

Распределение предприятий по величине среднегодовой стоимости основных фондов и выпуску продукции

 

Среднегодовая стоимость основных производственных фондов, млн. руб. Выпуск продукции, млн. руб.
80,00 - 108,80 108,80 - 137,60 137,60 - 166,40 166,40 - 195,20 195,20 - 224,00
94,00 - 134,80      
134,80 - 175,60    
175,60 - 216,40
216,40 - 257,20      
257,20 - 298,00      

 

 

Ø Графический метод состоит в построении корреляционного поля - множества точек (xi, yj) в декартовой системе координат (X,Y) (рис.3, 4). По характеру расположения точек корреляционного поля можно сделать вывод о наличии или отсутствии стохастической связи и о характере связи (линейная или нелинейная, а если связь линейная - то прямая или обратная).

При отсутствии тесной связи имеет место беспорядочное расположение точек на графике (рис.5а). Чем сильнее связь между признаками, тем теснее будут группироваться точки вокруг некоторой определенной линии, выражающей форму связи, т.е. возле линии регрессии (рис.5, 6). Если имеется тенденция равномерного изменения значения результативного признака Y, то можно предположить наличие прямолинейной корреляционной связи, в случае неравномерного изменения Y – наличие криволинейной корреляционной связи.

На рис.5 представлено графическое изображение некоторых типов парной корреляции признаков.

 
 

 

 


Рис. 5. Разновидности корреляционного поля признаков Х и Y.

Наличие корреляционной взаимосвязи признаков может быть также установлено по виду графика эмпирической линии связи для условных или групповых средних признака Y (рис.5, 6)

 

Оценка тесноты связи.

При использовании метода аналитической группировки оценивается (на основе данных аналитической таблицы) степень тесноты корреляционной связи признаков Х и Y, для чего рассчитываются специальные показатели:

r - линейный коэффициент корреляции, измеряющий тесноту связи в предположении линейности взаимосвязи признаков Х и Y;

- эмпирическое корреляционное отношение, выступающее как универсальный показатель тесноты связи при любой форме связи (как линейной, так и нелинейной);

- эмпирический коэффициент детерминации (причинности), определяющий силу связи, т.е. оценивающий,насколько вариация результативного признака Y объясняется вариацией фактора Х.

 

Расчет показателей производится по формулам:

, (9)

 

, (10)

где - межгрупповая дисперсия результативного признака Y, обусловленная влиянием только фактора Х;

- общая дисперсия признака Y, обусловленная влиянием на Y всех факторов, включая Х;

n - число единиц наблюдения (т.е. число пар (xi, yi)), суммирование в показателе r производится по всем n наблюдаемым признакам.

Межгрупповая дисперсия признака Y определяется на основе данных аналитической таблицы по формуле

, (11)

где - общая средняя признака Y для всей совокупности;

- среднее значение признака Y в j-ой группе,

nj - численность j-ой группы.

m - число выделенных групп;

Общая дисперсия признака Y вычисляется по формулам:

или , (12)

 

где ,

 

Для показателей силы и тесноты корреляционной связи характерны следующие свойства.

1. Значения показателей изменяются в пределах:

, ,

Чем ближе значения показателей к 1, тем теснее связь и больше сила связи.

Знак при r указывает на направление связи: знак «+» соответствует прямой линейной зависимости, знак «-» - обратной.

2. Для качественной оценки тесноты связи используется шкала Чэддока:

Значение показателей тесноты связи , 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Характеристика связи слабая умеренная заметная высокая весьма высокая

3. Если =1 или =1, то корреляционная зависимость становится полной, т.е. функциональной

4. Если =0, то между признаками Х и Y нет корреляционной связи Если r=0, то между изучаемыми признаками нет линейной корреляции, что не исключает, однако, существования какого-либо другого вида корреляционной зависимости (параболической, показательной или др.).

5. Факт совпадения или несовпадения значений показателей и r используется для оценки формы связи: =r только при наличии прямолинейной связи. Несовпадение этих показателей означает, что связь между признаками криволинейная. Установлено, что если

, (13)

то зависимость признака Y от фактора Х можно считать прямолинейной.

 




Поиск по сайту:

©2015-2020 studopedya.ru Все права принадлежат авторам размещенных материалов.