Автоматизация производства, технических объектов и систем представляет собой сложную научно-техническую проблему, которая решается с применением новых технологий, новой техники и методов управления. Большое значение для достижения высоких технико-экономических характеристик технологических объектов имеет теория и методы оптимального и адаптивного управления. Согласно международному стандарту IEEE термин "самоорганизующееся управление" заменил собой термин "адаптивное управление". По этому стандарту процесс управления называется самоорганизующимся, если уменьшение априорных неопределенностей, приводящее к эффективному управления процессом, достигается за счет использования информации, получаемой в ходе процесса управления из последовательных наблюдений доступных входных и выходных сигналов. Самоорганизующийся процесс управления называется параметрически адаптивным, если в процессе управления уменьшается априорная неопределенность некоторого вектора параметров, и функционально адаптивным, если в процессе управления осуществляется непосредственное уменьшение неопределенностей, приводящее к улучшению качества процесса.
Постановка задачи оптимального управления формулируется следующим образом [3]. Пусть поведение модели объекта управления описывается обыкновенным дифференциальным уравнением
, (1.46)
где x – вектор состояния системы, x=(xl,...,xn)T Rn, u – вектор управления, u=(u1,...,uq)T U – некоторое заданное множество допустимых значений управления, t – время, t Т=[t0,t1] – интервал времени функционирования системы; вектop-функция f(t,x,u) – непрерывна вместе со своими частными производными.
Момент начала процесса t0 задан, а момент окончания процесса определяется первым моментом достижения точкой с фазовыми координатами (t,x(t)) некоторой поверхности Г Rn+1 , где Rn – n-мерное евклидово пространство.
Т.е. в момент времени t1 должны выполняться условия
Гi(t1,x(t1))=0, i=1,…,k , (1.47)
где 0<k<n+1.
При k=n+1 множество Г представлено точкой в пространстве Rn+1. Начальное условие x(t0)= х0 задает начальное состояние в пространстве Rn+1.
Предполагается, что при управлении используется информация, доступаня в текущий момент времени, т.е. система управления в данном случае является разомкнутой по состоянию и рассматривается так называемое программное управление (рис. 1.10). Множество допустимых управлений U0 образуют кусочно-непрерывные функции u(•). Определим множество допустимых процессов D(t0,x0) как множество троек d=(t1,x(•),u(•)), которые включают момент времени окончания процесса t1, траекторию x(•) и управление u(•), где функции x(•) непрерывны и кусочно-дифференцируемы, а u(•) – кусочно-непрерывны.
Рис. 1.10. Программное траекторное управление объектом.
На множестве D(t0,x0) определим функционал качества управления
, (1.47)
где – заданные непрерывно дифференцируемые функции. Требуется найти такую тройку , что
I(d*)=min I(d) (1.48)
Задача (1.48) с функционалом (1.47) называется задачей Больца. Если в функционале отсутствует , так называемый терминальный член, то это – задача Лагранжа. Искомые функции x*(•), и u*(•) называются соответственно оптимальной траекторией и оптимальным управлением, а t1* – оптимальным временем окончания процесса.
Самоорганизующиеся системы управления.
Управление процессами/объектами с полностью или частично неизвестной динамикой требует создания систем управления имеющих большие возможности по принятию управляющих решений, чем обычные системы управления с линейной обратной связью. При этом различают неустранимые и устранимые неопределенности в описании объекта. К первым может быть отнесен случайный характер процессов в системе, связанный с принципиальными ограничениями в описании влияния на объект внешней среды. Самое большее, что можно в этом случае получить разработки модели – вычислить плотность вероятности случайного процесса. Этот подход применяется в системах стохастического управления. Второй тип неопределенностей обусловлен тем, что в момент создания системы разработчик еще не полностью знает ее свойства. В этом случае, степень недоопределенности может быть уменьшена самой системой управления во время ее функционирования. Такая возможность обычно достигается путем обеспечения возможностей самоорганизации системы, способных уменьшить неопределенности, присущие математической модели объекта и, в конечном счете, улучшить качество работы системы. Основная особенность самоорганизации ввиду наличия устранимых неопределенностей объекта состоит в совершенствовании описания модели системы в темпе реального процесса.
Первая попытка решить данную задачу, используя схему внутренней самоорганизации, была сделана Фельдбаумом, который назвал свой подход методом дуального управления. Система дуального управления по Фельдбауму это оптимальная система с неполной информацией об объекте и с активным накоплением информации на протяжении всего процесса управления. Другими подходами к разработке самоорганизующихся систем стали многочисленные методы адаптивного управления. Адаптацией называется процесс изменения параметров и структуры системы, а возможно, и управляющих воздействий на основе текущей информации с целью достижения определенного, обычно оптимального, состояния системы при начальной неопределенности и изменяющихся условиях работы. И, наконец, третий подход это так называемые обучающиеся системы управления или системы с элементами искусственного интеллекта. Под обучением подразумевается процесс выработки в некоторой системе той или иной реакции на внешние сигналы путем многократных воздействий на систему и внешней корректировки. Самообучение отличается от обучения отсутствием внешней корректировки, при этом дополнительной информации о верности реакции системе не сообщается.
Методы самоорганизующегося управления.
Проблема автоматической настройки регулятора может быть актуальной не только в случае нестационарных систем, когда определение параметров модели в ходе управления является насущной необходимостью, но и в случае постоянной и априори неизвестной динамики объекта. В такой ситуации применение регулятора с автонастройкой позволяет снизить расходы и сократить сроки внедрения системы управления ввиду отсутствия необходимости предварительного исследования объекта.
Автоматически настраиваемый регулятор имеет механизм настройки собственных параметров, поэтому он представляет собой двухконтурную замкнутую систему. Внутренний контур включает сам регулируемый объект и обычный линейный регулятор со звеном обратной связи. Внешний контур включает блоки рекурсивной оценки параметров и расчета закона управления. В целом такая система с самонастраивающимся регулятором является нелинейной и нестационарной.
Самонастраивающиеся регуляторы делятся на два класса: с явными и неявными методами настройки. В регуляторах с явными алгоритмами настройки производится оценка параметров явной модели объекта управления, а затем по ним рассчитываются параметры регулятора. В регуляторах с неявными алгоритмами модель объекта управления выражается через параметры самого регулятора и непосредственно не определяется.
Для явной настройки регуляторов могут использоваться различные методы параметрической идентификации, в том числе градиентные методы. Неявная настройка может осуществляться путем анализа динамических характеристик объекта.
Адаптивные системы управления с эталонной моделью.
По принципиальному подходу адаптивное управление с эталонной моделью относится к функционально адаптивным методам самоорганизующегося управления (Саридис), так как коррекция параметров управления здесь направлена непосредственно на улучшение качества работы системы. Одним из главных достоинств адаптивного управления с эталонной моделью является то, что обеспечение устойчивости входит непосредственно в сам алгоритм управления, поскольку последний строится с помощью функции Ляпунова.
Критерием качества в алгоритмах с эталонной моделью обычно является накопленная среднеквадратическая ошибка рассогласования между желаемым выходным сигналом, который получают, подавая входной сигнал на эталонную модель, и действительным выходом объекта. Однако для реализации алгоритма в темпе реального времени такой критерий должен быть заменен на поинтервальный критерий качества для достаточно малых промежутков времени ∆t. Такой критерий сам будет зависеть от времени, поэтому его минимизация на практике возможна только тогда, когда он меняется во времени значительно медленнее, чем идет поиск его минимума. Для целей минимизации этого критерия может быть использован обычный градиентный метод. Однако функции чувствительности выхода объекта к настраиваемому параметру не могут быть определены непосредственно, поэтому используются различные аппроксимации, которые и приводят к многочисленным алгоритмам адаптивного управления по эталонной модели.
Методы идентификации в самоорганизующихся системах.
В самоорганизующихся системах с явными алгоритмами адаптации используются самые разнообразные алгоритмы идентификации параметров моделей объектов управления. Чаще всего применяется рекуррентный метод наименьших квадратов и его модификации, а также различные алгоритмы стохастической аппроксимации. В последнее время более широко стали применяться методы идентификации, основанные на методах линейной и нелинейной фильтрации. Данные методы являются наиболее мощными, позволяющими одновременно получать оценки параметров и состояний линейных и нелинейных многомерных систем, представленных уравнениями в пространстве состояний. Главным недостатком таких методов являются слишком высокие вычислительные требования к процессору системы управления. Наиболее распространенным методом нелинейной фильтрации является расширенный фильтр Калмана, получаемый путем линеаризации относительно текущей оценки состояния.
Дуальное управление.
Задача дуального управления представляет собой обобщение задачи оптимального стохастического управления, поскольку она содержит неопределенности, которые могут быть частично или полностью устранены с помощью некоторой процедуры оценивания в процессе функционирования системы в соответствии с обновляющимися наблюдениями входного и выходного сигналов. В этом случае оптимальное управление имеет дуальный характер: оптимизирует заданный критерий качества и в то же время способствует накоплению информации о неизвестных параметрах. Задача дуального управления значительно сложнее задачи простого стохастического управления, и ее полное решение получено только для случаев так называемых нейтральных систем, которые составляют лишь очень малый подкласс систем, подающихся решению методами стохастического управления.
Решение, полученное методами дуального управления, представляет собой оптимальное решение задачи самоорганизующегося управления с адаптацией параметров. Однако оно не дает решения задачи самоорганизующегося управления с функциональной адаптацией, поскольку не указывает способа определения неизвестной структуры объекта или способа накопления информации об улучшении качества работы системы.
Самоорганизующееся управление с параметрической адаптацией.
Метод самоорганизующегося управления с параметрической адаптацией в отличие от метода дуального управления, ослабляя требование к оптимальности, позволяет получить реализуемые решения для современных систем в общем виде. Такого рода решения, не удовлетворяя требованию оптимальности в переходном режиме, тем не менее, могут быть асимптотически оптимальны или квазиоптимальны, обладая тем свойством, что по мере эволюции процесса, уменьшается неопределенность объекта.
В структурной схеме таких алгоритмов имеются блоки: идентификации параметров, оценивания состояния (если прямое измерение состояния объекта невозможно), а также блок вычисления детерминированного управления. Информация, вырабатываемая блоком идентификации, используется для коррекции детерминированного управляющего устройства, которое может быть асимптотически оптимальным, а также для коррекции устройства оценивания состояния объекта, которое также может быть асимптотически оптимальным.
Функционально адаптивные самоорганизующиеся системы управления.
При самоорганизующемся управлении с параметрической адаптацией недостающая информация о параметрах системы накапливается и с каждым уточнением оценок этих параметров связана перестройка управляющего устройства. Задача функционально адаптивного самоорганизующегося управления, в отличие от параметрически адаптивного, может быть сформулирована как задача улучшения управляющего устройства посредством изменения своего «поведения» и структуры в процессе управления. При этом функционирование системы описывается некоторым показателем качества, для улучшения которого в ходе процесса проводится структурная или параметрическая перестройка управляющего устройства. Такой подход напоминает действия обучающихся живых организмов, поэтому такие системы управления называют обучающимися. К более сложным управляющим системам с обучением следует отнести системы с элементами искусственного интеллекта.
Области практического применения методов самоорганизации в системах управления.
Автоматическая настройка стандартных (П, ПИ и ПИД) регуляторов – в настоящее время наиболее широкая область применения методов адаптации. Основные причины этого состоят в следующем: во-первых, такие регуляторы достаточно просты; во-вторых, они используются при управлении различными технологическими процессами в огромных количествах; в-третьих, время их разработки и внедрения относительно мало.
Другая причина повышенного практического интереса к методам адаптивного управления это стремление справиться с изменениями динамики объекта и возмущений в процессе эксплуатации. Типичные примеры – изменения из-за не измеряемых вариаций свойств сырья, износа механических систем, засорения теплообменников и т.п. В этих случаях возможно как применение стандартных самонастраивающихся регуляторов, так и построение самоорганизующихся управляющих устройств с эталонной моделью. Очень широко методы адаптации применяются в измерительных устройствах, а также в устройствах оценивания и фильтрации, когда имеются неопределенности внешних возмущений.
В промышленности, кроме стандартных регуляторов, можно отметить специализированные средства автоматической настройки с функциями самоорганизации, которыми временно заменяется обычный регулятор объекта. Далее производится автоматическая настройка системы (определение параметров регулятора), и затем устанавливается постоянный регулятор с уже установленными на нем новыми параметрами настройки.
Многие из распределенных иерархических систем управления технологическими процессами также снабжаются средствами самонастройки и самоорганизации.