Инструмент «Регрессия» используется для нахождения коэффициентов линейной регрессии и оценки их достоверности. Множественная линейная регрессия описывается уравнением: y=m1x1+m2x2+…+mnxn+b. Чтобы получить уравнение регрессии, надо определить коэф-ты m1,m2… и константу b. В основу работы этого инструмента заложен метод наименьших квадратов.
При заполнении диалога «регрессия» нужно задать:
1) Входной интервал y – это диапазон, в котором находятся значения зависимой переменной и имя переменной;
2) Входной интервал x –это диапазон значений независимых переменных вместе с именами(до 16 столбцов);
3) Устанавливаются флажки «метки» и «остатки»;
4) Выходной интервал, указывается одна ячейка, начиная с которой будет выводится результат.
Результаты регрессионного анализа выводятся в 4-х таблицах.
1таблица: вывод итогов - содержит значения среднеквадратичного отклонения у, коэффициента корреляции Пирсона и коэффициента детерминированности .
- это величина, характеризующая степень взаимосвязи между зависимой и независимой переменными.
изменяется от 0 до 1 позволяет сделать следующие выводы: по шкале Чеддока
от 0,1-0,3характеристика силы связи слабая
от 0,3-0,5 характеристика силы связи умеренная
от 0,5-0,7 характеристика силы связи заметная
от 0,7-0,9 характеристика силы связи высокая
от 0,9характеристика силы связи весьма высокая
2таблица: дисперсионный анализ, имеет ряд промежуточных вычислений и параметр значимости F (это вероятность того, что зависимость у от х отсутствует), которая используется для оценки достоверности уравнения регрессии. Вероятность того, что уравнение достоверно (зависимость существует) ( ):
Величина от 0 до 1
3таблица: параметры модели, содержит коэффициенты уравнения при х и константу b(в 1-й строке таблицы с подписью «у пересечения»). Кроме того, в столбце «Р значение» находятся вероятности того, что коэффициенты mi и b не достоверны. Тогда вероятность того, что они достоверны равна:
Достоверность уравнения считается высокой при значениях больше >0,7, в промежутке 0,5-0,7 – приемлемой, менее 0,5 – низкой.
4таблица: содержит расчетные значения y (предсказанные) и остатки – это разность между расчетным и фактическим значением y.
По этой таблице рассчитывается средняя ошибка аппроксимации, которая используется для оценки адекватности уравнения регрессии ( )
k – количество значений y или х
Если полученное значение не превышает 15%, то уравнение адекватно описывает данные.