Аналитическое решение задачи об оптимальной стабилизации линейных стационарных объектов при квадратичном функционале качества было предложено А. М. Летовым, которым были указаны пути преодоления трудностей решения краевых задач. Это направление получило название аналитического конструирования регуляторов. Благодаря ясной постановке задачи и конструктивным результатам данный метод стал распространенным инструментом синтеза оптимальных управлений для различных классов объектов. Одновременно с А. М. Летовым исследования в этом направлении проводились Р. Калманом и в зарубежных источниках получили название линейно-квадратичной оптимизации. Поэтому задача АКР еще называется задачей Летова-Калмана. Каждый из упомянутых подходов имеет свои особенности, однако оба решения приводят к аналогичным результатам, что свидетельствует о корректной постановке задачи синтеза.
Рассмотрим процедуру аналитического конструирования регуляторов для случая линейных стационарных объектов в постановке А. М. Летова.
Пусть возмущенное движение обобщенного объекта n-го порядка описывается системой линейных или линеаризованных дифференциальных уравнений возмущенного движения в форме Коши
, (8.65)
где bik, mi – постоянные коэффициенты.
Среди множества кусочно-гладких функций, подчиненных ограничению
(8.66)
необходимо найти оптимальное управление U(ηk), осуществляющее перевод системы (8.65) из начального положения в начало координат таким образом, чтобы функционал качества
(8.67)
принимал наименьшее значение.
Первоначально эта задача была сведена к задаче Лагранжа на условный экстремум. С этой целью система (8.65) представляется в виде
, (8.68)
и вводится в рассмотрение функционал
(8.69)
где λi(t) – неопределенные множители Лагранжа.
Затем путем решения уравнений Эйлера определяются экстремали ηi(t), λi(t) функционала (8.69). Уравнения Эйлера для функции L(η, U, λ, t) имеют вид
; (8.70)
(8.71)
Из уравнения (8.71) определяется оптимальное управление как функция неопределенных множителей Лагранжа
(8.72)
В результате подстановки (8.72) в (8.68) рассматривается система 2n уравнений с 2n неизвестными ηi(t), λi(t)
;
(8.73)
Для решения этой системы дифференциальных уравнений необходимо определить 2n корней характеристического уравнения системы (8.73)
(8.74)
которое обладает тем свойством, что если μ - любой его корень, то корнем будет число – μ. Для обеспечения устойчивости замкнутой системы (8.65) с управлением (8.72) в расчет принимаются n корней с отрицательной вещественной частью, а остальными n корнями, лежащими в правой полуплоскости, пренебрегают.
После этого общее решение системы (8.73) определяется в виде суммы экспоненциальных функций
, (8.75)
где – миноры i-го или (n+i)-гo элемента первой строки определителя (8.74), Ck – произвольные постоянные.
Для определения алгоритма оптимального управления в функции фазовых координат системы (8.65) необходимо выразить неопределенные множители Лагранжа λi через переменные ηi. Это осуществляется путем исключения из системы (8.75) экспоненциальных функций . В результате оптимальное управление приобретает вид
. (8.76)
Управление (8.76) найдено без учета ограничений (8.66). В замкнутой области, подчиненной условию (8.66), искомое оптимальное управление определяется выражением
(8.77)
Выражение (8.77) имеет более компактную форму записи
, (8.78)
где sat() – это функция, равная аргументу, когда он по модулю меньше единицы, и являющаяся знаковой функцией в противном случае.
Решение задачи АКР можно осуществить с использованием принципа максимума, для чего система (8.65) должна быть преобразована к виду
(8.79)
и введена дополнительная координата η0, удовлетворяющая соотношению
.
После этого составлена сопряженная система
(8.80)
и определена функция Гамильтона
(8.81)
Оптимальное управление, минимизирующее функционал (8.67), доставляет максимум функции (8.81) и определяется из условия
откуда с учетом того, что ,
(8.82)
Таким образом, оптимальное управление зависит от неизвестных пока функций ψk и может быть выражено через фазовые координаты объекта управления, если определить зависимость ψk(ηi). Для этого необходимо к системе (8.79) с учетом (8.82) присоединить сопряженную систему (8.80)
(2.83)
Система уравнений (8.83) идентична системе (8.73) и дальнейший ход решения ничем не отличается от рассмотренного выше. В результате определяется алгоритм оптимального управления (8.78).
Рассмотрим процедуру аналитического конструирования регуляторов в постановке Р. Калмана, использовавшего метод динамического прог-раммирования.
Оптимальное управление , принадлежащее классу кусочно-непрерывных функций, подчиненных ограничению (8.66), и доставляющее минимум функционалу
(8.84)
на траекториях движения системы (8.65), должно удовлетворять решению основного функционального уравнения Беллмана в частных производных
(8.85)
где S – функция Беллмана, которая при синтезе оптимальных управлений по минимуму функционала качества (8.84) однозначно может быть заменена функцией Ляпунова, т.к. уравнение (8.85) удовлетворяет условиям теоремы Ляпунова об устойчивости.
Функция Ляпунова V(η) для системы линейных дифференциальных уравнений (8.65) представляет собой положительно-определенную квадратичную форму
(8.86)
или в матричном виде
,
коэффициенты которой удовлетворяют критерию Сильвестра.
Продифференцировав основное функциональное уравнение Беллмана (8.85) по U, определим оптимальное управление, доставляющее минимум функционалу (8.84) на траекториях движения системы (8.65):
(8.87)
Матрица V является стационарным решением дифференциального уравнения Риккати
(8.88)
Из всех решений уравнений (8.88) следует выбрать такие, которые удовлетворяют критерию Сильвестра, т.к. только в этом случае обеспечивается выполнение теоремы А. М. Ляпунова об асимптотической устойчивости. Отыскание оптимального управления связано с необходимостью интегрирования матричного уравнения (8.88), избежать которого возможно, если принять матрицу V стационарной. В этом случае коэффициенты матрицы V определяются в результате численного решения матричного уравнения Риккати
(8.89)
Матричное уравнение (8.89) представляет собой систему нелинейных алгебраических уравнении относительно такого же количества неизвестных коэффициентов vik функции Ляпунова (8.86). Если в результате решения (8.89) эта функция найдена, то оптимальное управление с учетом ограничения (8.66) принимает окончательный вид