Как производится оценка взаимосвязи зависимой и независимых переменных? По какой формуле вычисляется и какие выводы позволяет сделать средняя ошибка аппроксимации?
Инструмент «Регрессия» используется для нахождения коэффициентов линейной регрессии и оценки их достоверности. Множественная линейная регрессия описывается уравнением: y=m1x1+m2x2+…+mnxn+b. Чтобы получить уравнение регрессии, надо определить коэф-ты m1,m2… и константу b. В основу работы этого инструмента заложен метод наименьших квадратов.
При заполнении диалога «регрессия» нужно задать:
1)Входной интервал y – это диапазон, в котором находятся значения зависимой переменной и имя переменной;
2)Входной интервал x –это диапазон значений независимых переменных вместе с именами(до 16 столбцов);
3)Устанавливаются флажки «метки» и «остатки»;
4)Выходной интервал, указывается одна ячейка, начиная с которой будет выводится результат.
Результаты регрессионного анализа выводятся в 4-х таблицах.
1.таблица: вывод итогов - содержит значения среднеквадратичного отклонения у, коэффициента корреляции Пирсона и коэффициента детерминированности .
- это величина, характеризующая степень взаимосвязи между зависимой и независимой переменными.
изменяется от 0 до 1 позволяет сделать следующие выводы: по шкале Чеддока
от 0,1-0,3характеристика силы связи слабая
от 0,3-0,5 характеристика силы связи умеренная
от 0,5-0,7 характеристика силы связи заметная
от 0,7-0,9 характеристика силы связи высокая
от 0,9характеристика силы связи весьма высокая
2.таблица: дисперсионный анализ, имеет ряд промежуточных вычислений и параметр значимости F (это вероятность того, что зависимость у от х отсутствует), которая используется для оценки достоверности уравнения регрессии. Вероятность того, что уравнение достоверно (зависимость существует) ( ):
Величина от 0 до 1
3.таблица: параметры модели, содержит коэффициенты уравнения при х и константу b(в 1-й строке таблицы с подписью «у пересечения»). Кроме того, в столбце «Р значение» находятся вероятности того, что коэффициенты mi и b не достоверны. Тогда вероятность того, что они достоверны равна:
Достоверность уравнения считается высокой при значениях больше >0,7, в промежутке 0,5-0,7 – приемлемой, менее 0,5 – низкой.
4.таблица: содержит расчетные значения y (предсказанные) и остатки – это разность между расчетным и фактическим значением y.
По этой таблице рассчитывается средняя ошибка аппроксимации, которая используется для оценки адекватности уравнения регрессии ( )
k – количество значений y или х
Если полученное значение не превышает 15%, то уравнение адекватно описывает данные.
Замечание: инструмент «Регрессия» используется также для нахождения коэффициентов полиномиальной регрессии, например, чтобы получить уравнение двух независимых переменных в виде полинома второй степени, нужно предварительно в соседних с х-ми столбцах вычислить квадрат х-ов и произведение х-ов и рассмотреть их как отдельные переменные (приводится к линейной регрессии 5ти независимых переменных). y=m1x1+m2x1+ m3x12+m4x22+ m5x1х2+b