Поставим задачу: найти такие значения неизвестных параметров a, b, … функции y = fa, b, …(x) (например, коэффициента k для функции y = k x), при которых эта функция наилучшим образом соответствует экспериментальным данным. Определим величину S, которая называется общим отклонением, как сумму квадратов отклонений δi «теоретических» значений fa, b, …(xi), найденных по эмпирической формуле y = fa, b, …(x), от соответствующих экспериментальных значений yi:
. (1)
В качестве критерия наилучшего соответствия формулы y = fa, b, …(x) экспериментальной зависимости между x и y потребуем, чтобы общее отклонение S было наименьшим.
Метод отыскания параметров, входящих в формулу y = fa, b, …(x), из требования, чтобы общее отклонение S было наименьшим, называется методом наименьших квадратов.
Для выбранного вида функции fa, b, …(x) общее отклонение S зависит лишь от параметров a, b, … Тогда условие минимума S можно записать следующим (известным) образом:
(2)
Очевидно, что число полученных уравнений равно числу неизвестных параметров функции fa, b, …(x). Решая систему уравнений (2), можно найти значения параметров a, b, …, при которых выбранная функция наилучшим образом расположится среди экспериментальных точек.
Следует отметить, что в качестве величины S можно было бы взять обычную сумму отклонений или сумму их абсолютных величин . Но делать это нецелесообразно, так как в первом случае сумма может быть малой или даже равной нулю при значительном разбросе экспериментальных точек, когда положительные отклонения компенсируются отрицательными. Во втором случае функция лишена этого недостатка, но имеет другой – она не является дифференцируемой, что существенно затрудняет дальнейшее решение задачи.
1.2. Погрешность параметров a, b, ...
Полученные из решения системы уравнений (2) формулы для расчета параметров a, b, … представляют собой выражения, зависящие только от измеренных значений x1, x2, …, xN и y1, y2, …, yN,
(3)
Полагая погрешность измерения значений x1, x2, …, xN пренебрежимо малой, можно считать, что разброс точек относительно выбранной функции в основном вызван погрешностью измерения yi. Тогда погрешность параметров a, b, … определяется погрешностью измерения каждой из N величин y1, y2, …, yN.
Переписывая выражения (3) как функции переменных yi:
(4)
замечаем, что погрешность параметров a, b, … можно вычислить по хорошо известным правилам расчета погрешности в косвенных измерениях:
. (5)
Погрешность параметра b и других параметров вычисляется по аналогичным формулам. Формулы вида (5) позволяют рассчитать погрешность определения параметров a, b, …, если известны погрешности Δy1,Δy2, …, ΔyN, с которыми измерены значения yi. (Например, каждое из значений yi измерялось многократно, и эти измерения обработаны как прямые измерения.)
Если значения yi измерены однократно и их погрешности неизвестны, то заметим, что погрешности отдельных измерений Δy1,Δy2, …, ΔyN – это погрешности измерения одной и той же величины y, так что в этом случае можно положить их равными:
Δy1 =Δy2 = …= ΔyN = Δy. (6)
Тогда погрешность Δy можно найти из следующих соображений. Значения yi разбросаны относительно своих наиболее вероятных значений . Полагая, что абсолютная погрешность близка стандартному отклонению, по аналогии с обычным расчетом погрешности прямых измерений для погрешности Δy можно написать:
. (7)
Знаменатель N – 2 приводит к неопределенности при N = 2 и отражает тот факт, что по двум точкам можно провести точно любую кривую. Если погрешность Δy, вычисленная по формуле (7), сравнима с инструментальной погрешностью измерения значений yi, то последнюю нужно добавить к Δy.
Вынося в формуле (5) из-под квадратного корня Δy, можно записать формулы:
(8)
позволяющие оценить погрешности, с которыми вычислены параметры сглаживающей функции.