Регрессионный анализ- статистический метод установления формы и изучения связей между метрической зависимой переменной и одной или несколькими независимыми переменными.
Регрессия – статистический метод, который используется для
описания характера связи между переменными (положительная
или отрицательная, линейная или нелинейная зависимость).
Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные — критериальными.
У=b0+b1X+Ui
Y=b0+b1X1+b2X2+Ui
Регрессионный анализ используют в следующих случаях:
1. Действительно ли независимые переменные обуславливают значимую вариацию зависимой переменной; действительно ли эти переменные взаимосвязаны?(есть ли взаимосвязь?)
2. В какой степени вариацию зависимой переменной можно объяснить независимыми переменными: теснота связи?(насколько тесная связь?)
3. Определить форму связи: математическое уравнение, описывающее зависимость между зависимой и независимой переменными.(какая форма связи?)
4. Предсказать значения зависимой переменной.(какой можно сделать прогноз. Основываясь на этой связи?)
5. Контролировать другие независимые переменные при определении вкладов конкретной переменной.
Регрессионный анализ имеет дело с природой и степенью связи между переменными и не предполагает, что между ними существует какая-либо причинная связь.
Парная регрессия- это метод установления математической (в форме
уравнения) зависимости между одной метрической зависимой (критериальной) переменной и одной метрической независимой переменной (предиктором).
Коэффициент детерминации- статистика, связанная с парным регрессионным анализом. Тесноту связи измеряют коэффициентом детерминации. Он колеблется в диапазоне между 0 и 1 и указывает на долю полной вариации У, которая обусловлена вариацией X.
6 этапов регрессионного исследования:
Шаг 1. Графически изображать пары значений (x, y).
Шаг 2. Если визуально просматривается связь, находить
Шаг 4. Если коэффициент значим, то находить уравнение
Регрессии.
Шаг 5. Строить разумные прогнозы: для значения независимой
Переменной х предсказать значение зависимой
Переменной у.
Шаг 6. Оценивать надежность прогноза: найти коэффициент
Детерминации, стандартную ошибку оценки и интервал
Предсказания.
Уравнение линейной регрессии:
Основное уравнение регрессии имеет вид Уi = B o+ Bi Xi + ei, где
Y~ зависимая или критериальная переменная, X— независимая переменная, или предиктор,
Bo— точка пересечения прямой регрессии с осью OY; Bi — тангенс угла наклона прямой и еi —
Остаточный член (остаток), связанный с i-м наблюдением, характеризующий отклонение от
Функции регрессии
Значимость коэффициентов линейной регрессии:
При интерпретации выходных данных необходимо учитывать значимость коэффициентов (столбец Sig. таблицы ANOVA): линейная регрессионная модель зависимости является надежной, если уровень значимости не превышает 0.05 (5%).
В таблице Coefficients (коэффициенты) приводятся рассчитанные коэффициенты регрессионной модели: регрессионный коэффициент, а также постоянная прямой. Значение в первой строке столбца В таблицы (Constant) – постоянная, во второй (где приведено имя переменной) – коэффициент. С помощью этих чисел можно записать уравнение прямой:
Теперь, используя это уравнение, можно по заданному значению независимой переменной вычислять значения (предсказанные) зависимой переменной.
В столбце Sig. таблицы Coefficients представлен уровень значимости для каждого регрессионного коэффициента. При 5%-ном уровне значимости можно считать неравными нулю только те коэффициенты, для которых значение Sig. не превышает 0.05.