ФЕДЕРАЛЬНОЕ АГЕНСТВО ПО ОБРАЗОВАНИЮ

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ «САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АЭРОКОСМИЧЕСКИЙ УНИВЕРСИТЕТ имени академика С.П.КОРОЛЕВА»

Ю. Заболотнов

ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ НЕПРЕРЫВНЫМИ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

Утверждено Редакционно-издательским советом университета в качестве учебного пособия

САМАРА 2005


УДК 519.9+534.1

Рецензенты: С.А. Ишков, Л.В. Кудюров

Заболотнов Ю.

Оптимальное управление непрерывными динамическими системами: учеб. пособие / Ю. Заболотнов ; Самар. гос. аэрокосм. ун-т. Самара, 2005. 149 с. : ил.

Пособие включает в себя описание методов оптимального управления динамическими системами. Особое внимание уделено оптимальному решению задачи стабилизации для линейных динамических систем. Наряду с изложением классических методов оптимального управления линейными системами, основанными главным образом на принципе динамического программирования Беллмана, рассматривается приближенно оптимальное управление колебательными динамическими системами с использованием метода усреднения.

Материал пособия входит в курс лекций «Теоретические основы автоматизированного управления», читаемых автором для студентов специальности 230102 – автоматизированные системы обработки информации и управления на кафедрах информационных систем и технологий, математики и механики СГАУ. Однако пособие может быть полезно для студентов других специальностей при изучении теории оптимального управления динамическими системами.


ПРЕДИСЛОВИЕ ……………………………………………………. 5

1. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ СИСТЕМАМИ ………………………….………………………….. 8

1.1. Постановка задачи оптимального управления динамическими системами …………………………….…...8

1.2. Программное оптимальное управление и задача

стабилизации ………………………………………………………. 11

1.3 . Невозмущенное и возмущенное движения динамической системы …………………………………………….………….. 12

1.4. Постановка задачи оптимальной стабилизации движения для линейной динамической системы.……………………………..… 14

2. УПРАВЛЯЕМОСТЬ И НАБЛЮДАЕМОСТЬ

ДИНАМИЧЕСКИХ СИСТЕМ ………………………………….….16

2.1. Подобные преобразования линейных динамических систем.16

2.2. Управляемость динамических систем.……………………….18

2.3. Наблюдаемость динамических систем ……………………….21

3. ПРИНЦИП ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ БЕЛЛМАНА И ТЕОРИЯ УСТОЙЧИВОСТИ ЛЯПУНОВА …….24

3.1. Принцип динамического программирования Беллмана …….24

3.2. Оптимальное управление линейными динамическими системами ………………………………………………..………… 29


3.3. Теория устойчивости Ляпунова ………………………………31

3.4. Связь метода динамического программирования с теорией устойчивости Ляпунова …………………………………………... 37

4. ОПРЕДЕЛЕНИЕ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДЛЯ ЛИНЕЙНЫХ ДИНАМИЧЕСКИХ СИСТЕМ …………………… 39

4.1. Решение уравнения Беллмана для линейных стационарных динамических систем..…………………………………………… 39

4.2. Решение уравнения Беллмана для линейных нестационарных динамических систем..…………………………………………… 41

4.3. О выборе критерия оптимальности при решении задачи стабилизации ……………………………………………………….43

4.4. Пример оптимального выбора коэффициентов регулятора

при управлении линейной системой второго порядка....……….. 47

5. ДИНАМИЧЕСКИЕ КОЛЕБАТЕЛЬНЫЕ СИСТЕМЫ ………….56

5.1. Малые колебания динамических.истем…………………….…56

5.2. Управляемость и наблюдаемость линейных колебательных динамических систем ………………………………………………. 65

5.3. Метод малого параметра..…………………………………….. 68

5.4. Метод усреднения..………………………………………….… 72

5.5. Метод усреднения для системы с одной степенью свободы.. 76

5.6. Метод усреднения для систем с несколькими быстрыми

фазами ………………………………………………………………. 79

5.7. Метод усреднения для системы с двумя степенями

свободы ………………………………………………………..…… 86

6. ПРИБЛИЖЕННО ОПТИМАЛЬНОЕ УПРАВЛЕНИЕ ДИНАМИЧЕСКИМИ КОЛЕБАТЕЛЬНЫМИ СИСТЕМАМИ.... 93

6.1. Управление линейной колебательной системой с одной степенью свободы ……………………………………………….… 93

6.2. Управление линейной колебательной системой с двумя степенями свободы..………………………………………………. 106

6.3. Влияние нелинейных возмущений на решение задачи оптимального управления …………//…………………………… 115

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ …..…………127

ПРИЛОЖЕНИЕ 1. Подобные преобразования линейных динамических систем …………………………………………..…129

ПРИЛОЖЕНИЕ 2. Качественное исследование линейных динамических систем на фазовой плоскости …………………… 134

ПРИЛОЖЕНИЕ 3. Дифференцирование функций с векторным аргументом ………………………………………………………... 142

ПРИЛОЖЕНИЕ 4. Основные понятия теории асимптотических рядов ………………………………………………………………. 143

ПРИЛОЖЕНИЕ 5. Усреднение тригонометрических

функций ………………………………………..………………….. 148

ПРЕДИСЛОВИЕ

Традиционно в классической теории управления рассматриваются две основные задачи: задача определения программного движения динамической системы и задача о проектировании регуляторов, реализующих заданное программное движение объекта управления (задача стабилизации). Основное внимание в пособии уделяется решению задачи стабилизации, при решении которой обычно используются линейные динамические модели. По сравнению со статическими системами в динамических системах процесс развивается во времени и управление в общем случае тоже является функцией времени.

При решении задачи стабилизации могут быть использованы различные методы. Здесь, прежде всего, следует отметить классические методы теории автоматического управления, основанные на аппарате передаточных функций и частотных характеристик. Однако появление быстродействующих ЭВМ привело к развитию новых методов, составляющих основу современной теории управления. В современной теории управления поведение системы описывается в пространстве состояний и управление системой сводится к определению оптимальных в некотором смысле управляющих воздействий на систему в каждый момент времени. Причем математическими моделями непрерывных динамических систем обычно являются системы обыкновенных дифференциальных уравнений, независимой переменной в которых является время.

При решении задачи стабилизации оптимальность управления понимается в смысле минимума некоторого критерия оптимальности (функционала), который записывается в виде определенного интеграла. Критерий оптимальности может характеризовать различные аспекты качества управления: затраты на управление (энергии, топлива и др.), ошибки управления (по различным переменным состояния) и т.д. Для определения оптимального управления при решении задачи стабилизации используется классический принцип динамического программирования Беллмана.

Первый раздел пособия является вводным: в нем производится математическая постановка задач, решаемых при управлении непрерывными динамическими системами. Второй раздел посвящен вопросам, предваряющим построение оптимального управления для линейных систем: вопросам управляемости и наблюдаемости. В третьем разделе выводятся основные соотношения принципа динамического программирования Беллмана, из которых далее определяется оптимальное управление для линейной динамической системы при решении задачи стабилизации. В этом же разделе показывается, что принцип динамического программирования Беллмана для линейных систем органически связан со вторым методом Ляпунова, выполнение теорем которого обеспечивает решение задачи стабилизации. В четвертом разделе пособия излагаются алгоритмы определения оптимального управления при решении задачи стабилизации при заданном квадратичном критерии оптимальности (подынтегральная функция функционала является квадратичной формой от управления и переменных состояния системы). Приводится пример определения оптимального управления с заданным критерием оптимальности для конкретной линейной системы. В пятом разделе излагаются основы теории динамических колебательных систем. Выводятся основные соотношения принципа усреднения, позволяющего во многих случаях существенно упростить анализ и синтез колебательных систем. В шестом разделе рассматривается метод определения приближенно оптимального управления для задачи стабилизации колебательными системами. Приводятся примеры управления колебательными системами с одной и с двумя степенями свободы. Анализируются вопросы возможного влияния нелинейных возмущений на решение задач стабилизации колебательных систем.

Методы, изложенные в пособии, позволяют найти оптимальное управление для решения задач стабилизации динамических систем в виде аналитических функций, зависящих от переменных состояния системы. В этом случае говорят, что решается задача синтеза управления. Эти методы можно отнести к теории аналитического конструирования регуляторов, являющейся одной из важных направлений развития современной теории управления.

Материал пособия основывается на работах в области теории управления, которые с течением времени уже стали классическими. Здесь прежде всего необходимо отметить работы Понтрягина Л.С. , Летова А.М. , Демидовича Б.П. , Гропа Д. , Беллмана Р. , Моисеева Н.Н., Боголюбова Н.Н., Митропольского Ю.А. и др. известных отечественных и зарубежных ученых.


1. ОСНОВНЫЕ ТЕОРЕТИЧЕСКИЕ ПОЛОЖЕНИЯ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ ДИНАМИЧЕСКИМИ СИСТЕМАМИ

1.1. Постановка задачи оптимального управления динамическими системами

Математические модели динамических систем могут быть построены в различных формах. Это могут быть системы обыкновенных дифференциальных уравнений, дифференциальных уравнений в частных производных, соответствующие дискретные модели и др. Отличительной особенностью математического описания любой динамической системы является то, что ее поведение развивается во времени и характеризуется функциями ,… , которые называются переменными состояния (фазовыми координатами) системы. В дальнейшем будем рассматривать системы с непрерывным временем. Движение динамической системы может быть управляемым и неуправляемым. При реализации управляемого движения поведение динамической системы зависит также от управляющих функций ,… . Предположим также, что поведение системы определяется однозначно, если задана вектор-функция управления и начальное фазовое состояние , где - начальное время.

В качестве математической модели динамической системы будем рассматривать систему обыкновенных дифференциальных уравнений, записанную в нормальной форме Коши

где , , - известная вектор-функция.

К системе (1.1) чаще всего приводятся разнообразные математические модели динамических систем с непрерывным временем. Так, например, если поведение динамической системы описывается системой дифференциальных уравнений в частных производных и происходит в пространстве и во времени (математические модели механики сплошной среды), то, производя дискретизацию по пространству (конечно элементный подход), приходим к системе обыкновенных дифференциальных уравнений подобной (1.1), решение которой ищутся как функции времени.

Введенное ранее предположение об однозначности процесса управления для системы (1.1) определяется выполнением условий теоремы о существовании и единственности решений систем обыкновенных дифференциальных уравнений в форме Коши .

Сформулируем задачу оптимального управления системой (1.1) . В начальный момент система (1.1) находится в состоянии , необходимо определить такое управление , которое переведет систему в заданное конечное состояние (отличное от начального), где - конечное время. Обычно требуется, чтобы переход из точки в точку (переходный процесс) был в определенном смысле наилучшим из всех возможных переходов. Например, если рассматривается некоторая техническая система, то переходный процесс должен удовлетворять условию минимума затраченной энергии или условию минимума времени перехода. Такой наилучший переходный процесс принято называть оптимальным процессом.

Функция управления обычно принадлежит некоторой области управления , которое является множеством -мерного евклидова пространства. В технических приложениях предполагают, что область есть замкнутая область, то есть область, включающая свои границы. Допустимым управлением будем называть любое управление , переводящее систему из точки в точку . Для количественного сравнения различных допустимых управлений вводят критерий оптимальности, который, как правило, представляют в виде некоторого функционала

Функционал вычисляется на решениях системы (1.1) , удовлетворяющих условиям и , при заданном допустимом управлении .

Окончательно, задача оптимального управления формулируется следующим образом: в фазовом пространстве даны две точки и ; среди всех допустимых управлений , переводящих фазовую точку из положения в положение , найти такое, для которого функционал (1.2) принимает наименьшее значение.

Управление , дающее решение поставленной выше задачи, называется оптимальным управлением и обозначается , а соответствующая траектория - оптимальной траекторией.

Замечание. Если необходимо обеспечить максимум некоторого критерия, то можно свести данную задачу к задаче поиска минимума формально изменив знак перед функционалом (1.2).

Частным случаем поставленной задачи оптимального управления является случай, когда . Тогда функционал (1.2) принимает вид и оптимальность заключается в реализации минимального времени перехода из точки в точку . Такую задачу оптимального управления называют задачей быстродействия.


1.2. Программное оптимальное управление и задача стабилизации

Рассмотрим движение динамической системы (1.1). Пусть для этой системы найдено оптимальное управление и получена соответствующая оптимальная траектория . При реализации оптимальной траектории в технических задачах неизбежно наталкиваются на существенные трудности, заключающиеся в невозможности, во-первых, точно установить реальную систему (или объект управления) в начальное состояние , во-вторых, точно реализовать само оптимальное управление , в третьих, точно предсказать заранее внешние условия функционирования системы (приближенность исходной математической модели). Все это приводит к необходимости решать задачу о коррекции закона оптимального управления в процессе функционирования любой технической системы (или объекта). Таким образом, задачу оптимального управления в реальных условиях можно разделить на две части: 1) построение номинального оптимального управления исходной динамической системой в идеальных условиях в рамках математической модели (1.1); 2) построение корректирующих управляющих воздействий с целью реализации заданного номинального оптимального управления и оптимальной траектории в процессе функционирования системы. Первую часть задачи оптимального управления принято называть задачей построения оптимального программного управления , причем она решается в рамках априорной информации, известной заранее о рассматриваемой системе. Вторую часть задачи называют задачей стабилизации заданной номинальной программы управления и решаться она должна в процессе функционирования системы по информации, поступающей от измерительных устройств системы управления. Задача стабилизации номинальной программы управления тоже может быть поставлена как задача поиска оптимального управления по соответствующему критерию, что будет сделано ниже (см. раздел 1.4).

Замечание. Очевидно, что в качестве номинальной программы управления может быть использована не только оптимальное управление , но и любое другое допустимое управление (если задача оптимизации программного управления не решается). В частном самом простом случае может быть, например, поставлена задача о стабилизации некоторого постоянного положения системы .

1.3. Невозмущенное и возмущенное движения динамической системы

Так как реальное движение системы неизбежно отличается от номинального программного, то этот факт привел к концепции невозмущенного и возмущенного движений Ляпунова А.А. . Так, любое программное движение системы (1.1), независимо от того является ли оно оптимальным или допустимым называется невозмущенным движением. Причем этому движению соответствует некоторое частное решение системы (1.1). Возмущенное движение оценивается при этом некоторыми отклонениями от невозмущенного движения. Следовательно, возмущенное движение будет описываться следующими переменными

где переменные и характеризуют номинальную программу управления, а переменные и - отклонения от номинальной программы.

Подставляя соотношения (1.3) в систему (1.1), получим

Прибавляя и отнимая в правой части системы (1.4) одинаковое слагаемое и учитывая, что

получим систему в отклонениях от номинального движения

где , , а определяются в результате решения системы (1.5).

Обычно считают, что отклонения и от номинального движения являются малыми величинами. Поэтому, если разложить функцию в ряд Тейлора и ввести обозначения , , где индекс (o) означает, что частные производные определяются для заданной номинальной программы, то получим

Здесь функция определяет слагаемые второго порядка и выше по отклонениям ; матрицы и выделяют линейную часть ряда и имеют компоненты и ; .

Уравнения, записанные в отклонениях (1.7), имеют большое значение в теории управления. На основании этих уравнений производится постановка большого количества задач оптимизации, имеющих практический интерес. Одна из этих задач – задача стабилизации, сформулированная выше. При решении этой задачи требуется определить, как следует выбрать корректирующие управляющие воздействия , чтобы уменьшить отклонения в некотором смысле наилучшем образом.

1.4. Постановка задачи оптимальной стабилизации движения для линейной динамической системы

Чаще всего при решении задачи стабилизации движения системы или объекта управления используется линейная динамическая система в отклонениях, получающаяся из системы (1.7) отбрасыванием нелинейных слагаемых . Тогда

где матрицы и в общем случае являются функциями времени, так как зависят от номинальной программы управления . , причем, то говорят, что решается задача синтеза управления. После подстановки закона. Рассмотрим случай, когда матрица не имеет кратных (одинаковых) собственных значений. В этом случае подобное преобразование приводит матрицу к диагональному виду , где - диагональная матрица, на главной диагонали которой стоят собственные значения матрицы (доказательство приводится в Приложении 1).

Выходные данные сборника:

УПРАВЛЕНИЕ С ПЕРЕМЕННОЙ СТРУКТУРОЙ СЛОЖНЫМИ ДИНАМИЧЕСКИМИ ОБЪЕКТАМИ

Маркин Василий Евгеньевич

канд. техн. наук, доцент МГУ им. адм. Г.И. Невельского, г. Владивосток

Воробьев Алексей Юрьевич

канд. техн. наук, доцент ДВФУ, г. Владивосток

Актуальной задачей современной теории управления является создание высокоэффективных алгоритмов и систем управления для управления сложными динамическими объектами. К классу сложных динамических объектов можно отнести такие объекты, как манипуляционные роботы, подводные аппараты, станки для сложной обработки т. д. Характерными особенностями подобных объектов являются большая размерность математической модели, нелинейности различного вида в математической модели, многосвязность, а также значительная структурная и параметрическая неопределенность, проявляющаяся в процессе функционирования.

Причинами параметрической неопределенности могут быть как динамические свойства самого объекта (например, изменение конфигурации манипулятора приводит к многократному изменению приведенного момента инерции), так и действие среды. Математически такой вид неопределенности можно оценить следующим образом:

где P i - некоторый параметр. В процессе функционирования параметры объекта могут принимать значение из диапазона между минимальным и максимальным значением.

Для синтеза алгоритмов и систем управления сложными динамическими объектами в условиях неопределенности используются различные подходы: адаптивный, робастный, нейросетевой и т. д. В работе в качестве базового используется алгоритм управления с переменной структурой. Работающие с использованием данного алгоритма системы с переменной структурой (СПС) известны достаточно давно как релейные системы с разрывным управлением . Управление с переменной структурой обычно строится в следующем виде:

(2)

где - уравнение поверхности переключения (скольжения) в пространстве состояния R n , содержащем фазовые координаты объекта x 1 ,…x n . Традиционно рассматриваются системы второго порядка, в этом случае пространство состояний вырождается в фазовую плоскость, а поверхность переключения - в линию переключения . Уравнение поверхности (линии) переключения может быть как линейным, так и нелинейным. В простейшем случае линия переключения представляет собой прямую. В этом случае поверхность переключения задается некоторым вектором параметров C размерности (n x 1), где n - порядок системы. Характерная особенность систем с переменной структурой (СПС) - наличие так называемого скользящего режима . Скользящий режим - особый динамический режим системы, движение в котором происходит по поверхности переключения s= 0, построенной в фазовом пространстве R n (рис. 1).

Рисунок1. Скользящий режим в СПС

Основное условие существования скользящего режима определяется следующим образом :

В скользящем режиме система работает в режиме переключений, происходящих теоретически с бесконечно большой частотой. Траектория движения системы теоретически определяется лишь уравнением линии переключения, не зависящим от параметров системы (например, от варьируемой нагрузки). Переходные процессы в скользящем режиме устойчивы и монотонны. Для обеспечения приемлемых динамических свойств системы необходима начальная настройка параметров, для которой традиционно применяется минимаксный метод: вектор параметров c выбирается таким, чтобы при любом наборе начальных условий выполнялось условие существования скользящего режима (3). Иначе говоря, значения коэффициентов линии переключения выбираются с учетом максимального значения изменяющегося параметра p i max (1). Это позволяет обеспечить возникновение скользящего режима при любых начальных условиях. Вместе с тем быстродействие системы (которое также определяется значениями элементов вектора c ) становится невысоким. Это является одним из основных недостатков традиционных СПС. Для увеличения быстродействия применяется адаптация по параметру скользящего режима . Адаптивный алгоритм настройки коэффициента линии переключения c имеет следующий вид:

(4)

где k c - коэффициент пропорциональности, m, m d - соответственно текущее и эталонное значения параметра скольжения .

В работе исследуется адаптивное управление приводом манипуляционного робота. Структурная схема системы автоматического управления приведена на рис. 2.

Рисунок 2 . Структурная схема системы управления приводом степени подвижности

Для реализации принципа переменности структуры в работе применяется релейное управление:

В свою очередь,

, (6)

где c - коэффициент плоскости скольжения (переключения).

Для имитационного моделирования использовался пакет Simulink, входящий в Matlab. Результаты моделирования в виде трехмерной фазовой траектории системы представлены на рис. 3.

Рисунок 3. Фазовые траектории и временные процессы системы третьего порядка: 1 - без адаптации, 2- с адаптацией.

Моделирование показывает существенное улучшение быстродействия при использовании адаптивного управления. Кроме того, имеет место существенное улучшение динамических показателей качества по сравнению с традиционными алгоритмами управления.

Дальнейшее направление исследований - обеспечение большей робастности алгоритмов управления по отношению к параметрам объекта и регулятора. Таким образом, разработаны алгоритмы управления сложным динамическим объектом высокого порядка в условиях существенной параметрической неопределенности. На основе предложенных алгоритмов синтезированы адаптивные системы управления. Проведены численные эксперименты, продемонстрировавшие высокую эффективность предложенных решений.

Список литературы:

1.Дыда А.А., Маркин В.Е. Системы управления с переменной структурой с парными и нелинейно деформируемыми поверхностями переключения. // Проблемы управления. - 2005, № 1. С. 22-25.

2.Маркин В.Е. Субоптимальное по быстродействию управление сложными динамическими объектами в условиях неопределенности. / Труды XIII Байкальской Международной школы-семинара по методам оптимизации. Т. 2 - Иркутск, 2005. С. 177-181.

3.Теория систем с переменной структурой. / Под ред. С.В. Емельянова - М.: Наука, Главная редакция физико-математической литературы, 1970 - 592 с.

4.Уткин В.И. Скользящие режимы в задачах оптимизации и управления. - М: Наука, Главная редакция физико-математической литературы, 1981 - 368 с.

5.Dyda A.A. Design of Adaptive VSS algorithms for Robot Manipulator Controls. Proc. Of First Asia Control Conference. Tokyo, July 27-30, 1994. Pp 1077-1080.

Задача динамического наблюдения , которая сначала называлась задачей асимптотического наблюдения , в существующем виде сформулирована американским ученым Д. Люенбергером в 1971 году. Термины «динамическое наблюдение» или «асимптотическое наблюдение» не полностью отражают существо проблемы, которая состоит в решении задачи восстановления вектора состояния динамического объекта (процесса) в специально создаваемой динамической среде на основе доступной информации . Следует заметить, что доступная информация может быть представлена в двух формах: в форме результатов непосредственных измерений и модельной форме динамической среды , генерирующей экзогенное воздействие.

Не всегда удается обеспечить и асимптотический характер процесса наблюдения в силу неполной измеримости переменных и воздействий, наличия неконтролируемых помех, неучтенные факторы модельного и сигнального характера и т.д. В этой связи представляется наиболее корректным использовать понятие «динамическое наблюдающее устройство » (ДНУ), возможно также появление терминологического вульгаризма «наблюдатель ».

Первоначально основной сферой использования ДНУ были динамические системы , в состав которых входят формирователи сигналов управления, использующих информацию в виде прямых и обратных связей по состоянию объекта или источника конечномерного экзогенного воздействия. В настоящее время сфера использования ДНУ заметно расширилась за счет нового поколения измерительных комплексов , которые решают задачу формирования результата измерения в алгоритмической среде ДНУ. Ниже рассматриваются вопросы, связанные с использованием ДНУ в составе формирователей сигналов управления.

В предыдущих разделах рассмотрены алгоритмы формирования сигналов управления, опирающиеся на единую системную концепцию подобия , которая реализовалась в одном случае в методе модального управления динамическим объектом, в другом – методе обобщенного изодромного управления. Прежде, чем решать задачи динамического наблюдения в рамках каждого из этих методов управления дадим общесистемное определение динамическому наблюдающему устройству.

В общесистемной постановке наибольшее количество информации о ходе управляемых процессов (динамических объектов) содержится в векторе состояния, который характеризуется наибольшей по сравнению с другими переменными процесса размерностью. Но состояние есть скрытая (внутренняя) переменная, несущая полную информацию о системном «секрете» процесса, она не должна быть доступна непосредственному измерению в полном объеме. Внешними переменными являются вектор выхода , вектор сигнала управления , вектор ошибки воспроизведения задающего экзогенного воздействия , иногда само воздействие . Информационная среда может быть дополнена моделью источника экзогенного воздействия (МИЭВ).

Теперь можно дать определение динамического наблюдающего устройства (ДНУ).

Определение 16.1 (О16.1). Динамическое наблюдающее устройство представляет собой техническую или алгоритмическую среду , которая реализует функциональное отображение всех доступных непосредственному измерению: компонентов
задающего воздействия
, компонентов
вектора ошибки
, сигнала управления
, компонентов
вектора выхода
, а возможно и компонентов
вектора состояния
в вектор
оценки вектора состояния, обладающий асимптотическим свойством, что представляется записью

где
– матрица в общем случае особого (необратимого) преобразования.

В большинстве практических случаев задача динамического наблюдения решается на парах , а в случаях, когда задача сводится к автономной версии динамической системы – то на векторах выхода
или ошибки
.

Примечание 16.1 (ПР.16.1). Ниже рассматриваются проблемы синтеза динамического модального и динамического обобщенного изодромного управлений , которые решаются на основе агрегирования динамических наблюдающих устройств и устройств формирования сигналов управления, полученных на основе гипотезы о полной измеримости вектора состояния объекта. В этой связи модальное управление и обобщенное изодромное управление, сформированные таким образом (т.е. методами, описанными в разделе 15) в отличие от динамических будем именовать алгебраическим модальным и алгебраическим обобщенным изодромным управлениями.

Рассмотрим случай модального управления. Поставим задачу формирования наблюдающего устройства, позволяющего восстановить вектор
состояния непрерывного динамического объекта, имеющего векторно-матричное описание

Прежде, чем приступить к решению задачи формирования динамического наблюдающего устройства, рассмотрим одну «гипотетическую» ситуацию. Для этого предположим, что , тогда приполной измеримости вектора
вектор
состояния объекта (16.2)при полной его неизмеримости может быть восстановлен в силу соотношения

(16.3)

Нетрудно видеть, что такое наблюдающее устройство следует назвать «статическим», так как оно обладает нулевой динамикой.

На основе рассмотренной «гипотетической» ситуации можно сформулировать следующее утверждение без доказательства.

Утверждение 16.1 (У16.1). Для корректного функционирования динамического наблюдающего устройства, при котором могут быть восстановлены все компонентов вектора
состояния объекта, у которого
, необходимо выполнение условия

где
вектор состояния динамического наблюдающего устройства.

Примечание 16.2 (ПР.16.2). Ситуация, когда имеет место выполнение неравенства , используется в случае, когда процесс измерения вектора
динамического объекта сопровождается заметными помехами так, что на ДНУ возлагаются задачавосстановления вектора состояния объекта с одновременной фильтрацией измерений.

Вернемся к соотношению (16.1) для анализа системной нагрузки, возлагаемой на матрицу подобия
размерности
. Размерность и вид этой матрицы полностью отражает все многообразие вариантов построения динамических наблюдающих устройств, так:

– если
при
и при этом
полной размерности и в базисе наблюдаемого динамического объекта ;

– если
при
и при этом
, то динамическое наблюдающее устройство строитсяполной размерности в базисе, не совпадающем с базисом наблюдаемого динамического объекта , чаще всего это какой-либо канонический базис ;

– если
при
, то динамическое наблюдающее устройство строитсянеполной размерности в произвольном базисе, чаще всего это какой-либо канонический базис ; в этом случае для восстановления всех компонентов вектора состояния объекта используется композиция из измерения вектора выхода и вектора состояния ДНУ, а также матрица, составленная из матриц
.

Динамические наблюдающие устройства полной размерности в базисе исходного объекта строятся на основе следующих системных соображений , содержащихся в следующем утверждении.

Утверждение 16.2 (У16.2). Динамическое наблюдающее устройство вектора
состояния непрерывного объекта управления (16.2), реализующееалгоритм наблюдения , записываемый в векторно-матричной форме

где
вектор состояния ДНУ,
, характеризуется процессом сходимости оценки
к оцениваемому вектору
состояния объекта (16.2), определяемым алгебраическим спектром собственных значений матрицы

. □(16.6)

Доказательство. Для доказательства справедливости сформулированного утверждения введем в рассмотрение вектор
невязки наблюдения , который для общего случая задачи наблюдения имеет представление

, (16.7)

а для рассматриваемого случая в силу равенства
принимает вид

. (16.8)

Нетрудно видеть, что процесс сходимости
к оцениваемому вектору
в форме (16.1) с использованием вектора
невязки наблюдения принимает вид

. (16.9)

Построим модель динамики сходимости процесса наблюдения, используя вектор невязки наблюдения (16.8).Дифференцирование по времени (16.8) с последующей подстановкой в результат дифференцирования соотношений (16.2) и (16.5) дает

что записывается в форме

откуда для вектора
невязки наблюдения можно записать

Примечание 16.3 (ПР.16.3). Если начальные состояния объекта управления (16.2) и ДНУ (16.5), то в силу (16.11) невязка наблюдения
и наблюдаемый вектор
и его оценка
тождественно совпадают, то есть выполняется соотношение

Введем определение динамического модального управления .

Определение 16.2 (О16.2). Динамическим модальным управлением будем называть управление вида (15.48), в котором отрицательная обратная связь по вектору
состояния объекта управления заменена на обратную связь по вектору
оценки вектора
, формируемому в зависимости отреализации матрицы
в силу соотношений:

1. при


(16.12)

2. при (16.13)

3. при (16.14)

Построим теперь алгоритм синтеза динамического модального управления для случая формирования оценки
вектора
состояния объекта вида (16.12), формируемой в среде ДНУ (16.5).

Введение. Рыночная экономика в Украине требует новых подходов к управлению: на первый план выходят экономические, рыночные критерии эффективности. Научно-технический прогресс и динамика внешней среды заставляют современные производственные предприятия трансформироваться в более сложные системы, для которых необходимы новые методы управления. Усиление рыночной ориентации предприятий, резкие изменения внешней среды вызывают необходимость разработки конкурентоспособных систем управления, призванных вырабатывать комплексные управленческие решения, а следовательно и более эффективных подходов и алгоритмов решения задач большой размерности.

Работа выполнялась согласно государственной научно-технической программы 6.22 – перспективные информационные технологии и системы планы научной и научно-технической деятельности Одесского ордена Ленина института Сухопутных войск на 2004 год, соответственно к тематике научно-исследовательских работ.

Анализ последних исследований.В настоящее время одним из основных и наиболее эффективных подходов к решению задач управления большой размерности является декомпозиция . Этот подход объединяет группу методов, основанных на разложении исходной задачи большой размерности на подзадачи, каждая из которых существенно проще исходной и решается независимо от других. Связь между отдельными подзадачами осуществляется с помощью «координирующей» задачи, которая тоже проще исходной. Для этого задачу управления приводят к виду, удовлетворяющему требованиям декомпозируемости, основными из которых являются: аддитивность (сепарабельность) целевой функции; блочный характер ограничений; наличие блочных связей. Однако при решении практических задач синтеза оптимального управления большой размерности зачастую сложно удовлетворить перечисленным требованиям. Например, качество работы производственной системы может оцениваться критерием весьма общего типа, который может быть несепарабельным по отношению к задачам управления отдельными подсистемами. Поэтому при проведении исходной задачи управления к виду, удовлетворяющему требованиям декомпозируемости, неизбежны как различные упрощения, аппроксимации, так и различные варианты разбиения задачи на локальные подзадачи, т.е. блоков ограничений и межблочных связей. Все эти факторы влияют как на качество решения, так и на сложность расчетов при поиске оптимального решения.

Ввиду отсутствия до настоящего времени способов качественной оценки влияния перечисленных факторов на качество решения представляется актуальным разработка такого способа решения задачи большой размерности, который бы оставлял определенную свободу в выборе структуры локальных задач, а также удовлетворяющего и оценивающего влияние различных упрощений на качество решений.

Из анализа литературных источников следует, что приемлемые численные методы решения нелинейных задач оптимизации связаны со значительными затратами машинного времени и памяти, а использование линеаризации приводит к потерям качества управления. Поэтому целесообразно, чтобы разрабатываемый новый метод решения задачи сохранял её нелинейный характер, а оптимальное управление определялось в рамках децентрализованной вычислительной структуры.

Объектом исследования являются алгоритмы решения задач управления большой размерности.

Предметом исследований является разработка подхода, основанного на идее эквивалентности или квазиэквивалентности исходной задачи большой размерности и соответствующей блочной декомпозиционной задачи.

Научная задача состоит в разработке алгоритмов, использование которых обеспечивало бы оптимальное управление в рамках децентрализованной структуры, без необходимости итерационного обмена информацией между уровнями управления.

Целью работы является разработка и дополнение элементов прикладной теории и проблемно-ориентированного инструментария оптимизации задач управления большой размерности.

Научная новизна состоит в разработке подхода к синтезу алгоритмов оптимизации задач управления большой размерности в рамках децентрализованной вычислительной структуры, при которой отпадает необходимость в организации итерационного процесса между уровнями управления.

Основной материал. Пусть, рассматриваемая задача оптимального управления непрерывной динамической системой, определяется дифференциальным уравнением

(1)

по критерию

(2)

при

где - n m – мерный вектор управления; - n – мерная функция, составляющая которой непрерывно дифференцируемы относительно аргументов; - выпуклая, дифференцируемая скалярная функция; - заданные соответственно начальный и конечный момент времени.

С целью представления объекта управления (1) в виде ряда взаимодействующих подсистем разложим (1) в ряд Тейлора относительно точки равновесия

где ,

или

(3)

В выражении (3) А и В представляют собой блочно-диагональные части матриц и соответственно, с блоками и .

а и - недиагональные части и соответственно.

Введением вектора взаимосвязи таким образом, что задаваемая в i – тая составляющая определяется выражением

, (4)

можно записать уравнение i – й подсистемы

где - - мерный вектор управления; - - мерный вектор состояния; - n – мерный вектор взаимосвязи.

Предлагаемый декомпозиционный способ синтеза оптимальных управлений состоит в следующем. Составляющую подсистему

и учитывающую взаимосвязь с другими подсистемами, назовем изолированной.

Композиция i – ых i = 1,2,…, Р подсистем представляет модель

(5)

где и - блочно – диагональные матрицы с блоками и соответственно.

Сформулируем критерий

, (6)

где - положительно – полуопределенная блочно – диагональная матрица

с блоками ; - положительно – определенная блочно – диагональная матрица

с блоками , - оптимальное управление.

Матрицы и определим из условия квазиэквивалентности задач (1) – (2) и (5) – (6), которое имеет вид

здесь , ,

где .

Для определения элементов матриц, имеем систему алгебраических уравнений

. (7)

После решения уравнения (7) имеем Р независимых задач оптимизации в связи с блочно – диагональной структурой матриц

,

Локальное оптимальное управление имеет вид

, (8)

, удовлетворяет линейному дифференциальному уравнению .

, . (9)

Глобальное решение является композицией оптимальных решений

. (10)

Выводы. Таким образом, задача синтеза оптимального управления для исходной задачи большой размерности (1) – (2) сводиться к следующему: формулировка локальных задач оптимизации (5) – (6); определение параметров локальных задач по формулам (3) и (6); решение локальных задач согласно (8) – (9); композиция локальных решений (10).

Потери качества при оптимальном подходе к синтезу приближенно оптимальных управлений можно оценить по формулам, предложенным в .

The new approach to problem solving of control, founded on idea of equivalence an initial problem of large dimension and conforming unitized offcomposite of a problem is offered.

1. Месарович М., Мако Д., Такахара И. Теория иерархических многоуровневых систем. – М.: Мир, 1973.

2. Аэсдон Л.С. Оптимизация больших систем. – М.: Мир, 1975.

3. Альбрехт Э.Г. Об оптимальной стабилизации нелинейных систем. – Прикладная математика и механика, 1961, т. 25.

4. Живоглядов В.П., Кривенко В.А. Способ декомпозиции задач управления большой размерности с несепарабельным критерием качества. Тезисы II Всесоюзной межвузовской конференции «Математическое, алгоритмическое и техническое обеспечение АСУ ТП». Ташкент, 1980.

5. Hassan Mohamed, Sinqh Madan G. The optimization for non – linear systemsusinq a new two level method. “Automatica”, 1976, 12, №4.

6. Mahmoud M.S. Dynamic multilevel optimization for a class of non – linear systems, “Int. J. Control”, 1979, 30, №6.

7. Кривенко В.А. Квазиэквивалентное преобразование оптимизационных моделей в задачах синтеза алгоритмов управления. – В кн.: Адаптация и оптимизация в больших системах. – Фрунзе, 1985.

8. Кривенко В.А. Способ синтеза алгоритмов управления с использованием идеи модификации целевой функции. – Фрунзе, 1985.

9. Румянцев В.В. Об оптимальной стабилизации управляемых систем. – Прикладная математика и механика, 1970, вып. 3.

10. Овезгельдыев А.О., Петров Э.Т., Петров К.Э. Синтез и идентификация моделей многофакторного оценивания и оптимизации. – К.: Наукова думка, 2002.

Ответы на вопросы

В рассмотренных примерах (задача о загрузке рюкзака и задача о надежности) для описания состояний системы использовалась только одна переменная, одной переменной задавалось и управление. В общем случае в моделях динамического программирования состояния и управления могут быть описаны с помощью нескольких переменных, образующих вектора состояния и управления.

Увеличение количества переменных состояния вызывает рост числа возможных вариантов решения, ассоциированных с каждым из этапов. Это может привести к так называемой проблеме «проклятие размерности», которая является серьезным препятствием при решении задач динамического программирования средней и большой размерности.

В качестве примера рассмотрим задачу о загрузке рюкзака, но уже при двух ограничениях (например, ограничение по весу и по объему):

где , . Поскольку в задаче имеется два вида ресурсов , то необходимо ввести два параметра состояния и . Обозначим , , . Тогда ограничения (1) можно привести к виду:

где . В рекуррентных уравнениях метода динамического программирования для задачи о «ранце» с двумя ограничениями (1):

каждая из функций , является функцией двух переменных. Если каждая из переменных , может принимать 10 2 значений, то функцию приходится табулировать в 10 4 точках. В случае трех параметров при тех же предположениях требуется вычислять 10 8 степени значений функций .

Итак, наиболее серьезным препятствием практического применения динамического программирования оказывается число параметров задачи.

Задача управления запасами.

Задача управления запасами возникает, когда необходимо создать запас материальных ресурсов или предметов потребления с целью удовлетворения спроса на заданном интервале времени (конечном или бесконечном). В любой задаче управления запасами требуется определять количество заказываемой продукции и сроки размещения заказов. Спрос можно удовлетворить путём однократного создания запаса на весь рассматриваемый период времени или посредством создания запаса для каждой единицы времени этого периода. Первый случай соответствует избыточному запасу по отношению к единице времени, второй – недостаточному запасу по отношению к полному периоду времени.

При избыточном запасе требуется более высокие удельные (отнесённые к единице времени) капиталовложения, но дефицит возникает реже и частота размещения заказов меньше. С другой стороны, при недостаточном запасе удельные капитальные вложения снижаются, но частота заказов и риск дефицита возрастают. Для любого из указанных крайних случаев характерны значительные экономические потери. Таким образом, решения относительно размера заказа и момента его размещения могут основываться на минимизации соответствующей функции общих затрат, включающих затраты, обусловленные потерями от избыточного запаса и дефицита.



Эти затраты включают в себя:

1. Затраты на приобретение, которые становятся особо важным фактором, когда цена единицы выражается в виде оптовых скидок в тех случаях, когда цена единицы продукции убывает с возрастанием размера заказа.

2. Затраты на оформление заказа представляют собой постоянные расходы, связанные с его размещением. При удовлетворении спроса в течении заданного периода времени путём размещения более мелких заказов (более часто) затраты возрастают по сравнению со случаем, когда спрос удовлетворяется посредством размещения более крупных заказов (и следовательно, реже).

3. Затраты на хранение запаса, которые представляют собой расходы на содержание запаса на складе (процент на инвестированный капитал, амортизационные расходы и эксплуатационные расходы), обычно возрастают с увеличением уровня запасов.

4. Потери от дефицита, обусловленные отсутствием запаса необходимой продукции. Обычно они связаны с экономическими санкциями со стороны потребителей, потенциальными потерями прибыли. На рис.1 иллюстрируется зависимость рассмотренных видов затрат от уровня запаса продукции. На практике какую-либо компоненту затрат можно не учитывать, если она не составляет существенную часть общих затрат. Это приводит к упрощению моделей управления запасами.


Типы моделей управления запасами.

Большое разнообразие моделей управления запасами определяется характером спроса на продукцию, который может быть детерминированным или вероятностным. На рис.2 приведена схема классификации спроса, принимаемая в моделях управления запасами.

Детерминированный статический спрос предполагает, что интенсивность потребления остаётся неизменной во времени. Динамический спрос - спрос известен, но изменяется в зависимости от времени.

Наиболее точно характер спроса может быть описан посредством вероятностных нестационарных распределений. Однако с математической точки зрения модель значительно усложняется, особенно при увеличении рассматриваемого периода времени.

По существу классификацию на рис.2 можно считать представлением различных уровней абстракции описания спроса.

На первом уровне предполагается, что распределение вероятностей спроса стационарно во времени, т.е. в течение всех исследуемых периодов времени используется одна и та же функция распределения вероятностей. При таком предположении влияние сезонных колебаний спроса в модели не учитывается.

На втором уровне абстракции учитываются изменения спроса от одного периода к другому. Однако при этом функции распределения не применяются, а потребности в каждом периоде описываются средней величиной спроса. Это упрощение означает, что элемент риска в управлении запасами не учитывается. Но оно позволяет исследовать сезонные колебания спроса, которые вследствие аналитических и вычислительных трудностей нельзя учесть в вероятностной модели.

На третьем уровне упрощения предполагается, что спрос в течении любого периода равняется среднему значению известного спроса по всем рассматриваемым периодам, т.е. оценить его постоянной интенсивностью.

Характер спроса является одним из основных факторов при построении модели управления запасами, но имеются и другие факторы, влияющие на выбор типа модели.

1. Запаздывание поставок. После размещения заказа он может быть поставлен немедленно или потребуется некоторое время на его выполнение. Интервал времени между моментом размещения заказа и его поставкой называется запаздыванием поставки. Эта величина может быть детерминированной или случайной.

2. Пополнение запаса. Процесс пополнения запасов может осуществляться мгновенно или равномерно во времени.

3. Период времени определяет интервал, в течение которого осуществляется регулирование уровня запаса. В зависимости от отрезка времени, на котором можно надёжно прогнозировать запас, рассматриваемый период принимается конечным или бесконечным.

4. Число пунктов накопления запасов. В систему управления запасами может входить несколько пунктов хранения запаса. В некоторых случаях эти пункты организованы таким образом, что один выступает в качестве поставщика для другого. Эта схема иногда реализуется на различных уровнях так, что пункт – потребитель одного уровня может стать пунктом – поставщиком на другом. В этом случае имеется система управления с разветвлённой структурой.

5. Число видов продукции. В системе управления запасами может фигурировать более одного вида продукции. Этот фактор учитывается при условии наличия некоторой зависимости между видами продукции. Так, для различных изделий может использоваться одно и тоже складское помещение или же их производство может осуществляться при ограничениях на общие производственные фонды.

Детерминированные модели управления запасами.

1.Детерминированная обобщённая модель определения оптимального размера партии продукции при допущении дефицита.

Рассматривается система управления запасами, когда продукция поступает на склад непосредственно с производственной линии с постоянной интенсивностью единиц продукции в единицу времени. При достижении некоторого уровня объёма запаса Q производство продукции прекращается. Возобновление производства и поставки продукции на склад осуществляется в момент, когда неудовлетворённый спрос достигнет некоторого значения G. Расходование запаса осуществляется с интенсивностью . Известны значения следующих параметров: - стоимость хранения единицы товара на складе в единицу времени; -стоимость организации заказа (одной партии продукции); - убытки от неудовлетворенного спроса (штраф). Требуется найти оптимальный объём партии продукции и интервал времени между точками возобновления поставки по критерию минимума общих затрат от функционирования системы управления запасами.

Графически условия задачи показаны на рис.3.

Из рисунка видно, что пополнение и расходование запаса осуществляются одновременно в течение интервала каждого цикла. Накопленный запас Q полностью расходуется в течение интервала . В течение интервала спрос не удовлетворяется, а накапливается. Неудовлетворённый спрос G покрывается в интервале .

Величина называется полным циклом управления запасом. - предельный запас продукции, G – предельный дефицит продукции.

Очевидно текущий уровень запаса продукции определяется по формуле:

Из треугольника OAB следует:

Аналогично можно определить , и (2)

Из подобия треугольников OAC и CEF можно записать Из равенства следует, что (3)

Выражение (3) с учётом (1) перепишется:

Тогда общая сумма затрат на пополнение, хранение запаса продукции и возможный штраф за неудовлетворительный спрос будет определяться выражением:

Если привести затраты в единицу времени, то выражение для удельных затрат будет иметь вид:

Таким образом, есть функция двух аргументов Q и T, оптимальные значения которых определяются как решение задачи:

Для того, чтобы найти минимум функции двух аргументов, необходимо и достаточно решить систему уравнений:

Это следует из факта, что функция является вогнутой функцией относительно своих аргументов. Решение системы уравнений (5) даёт следующие неотрицательные корни:

Минимум общих затрат в единицу времени составит:

Можно рассмотреть частные случаи.

1. Дефицит продукции не допускается. Решение задачи в этом случае получается из формулы (6)-(8), если положить штраф Тогда С 1 /С 3 =0 и оптимальные значения искомых величин будут:

Этому случаю соответствует график изменения уровня запаса во времени:

2. Пополнение запаса осуществляется мгновенно. В этом случае полагается и соответственно

График изменения уровня запаса имеет вид:

3. Дефицит не допускается, запасы пополняются мгновенно, т.е. . Тогда следует:

Эти формулы называются формулами Уилсона, а величина - экономическим размером партии.

График изменение уровня запаса имеет вид:


Динамические модели управления запасами.

В предыдущих лекциях были рассмотрены статические задачи управления запасами за один период. В ряде таких задач были получены аналитические выражения для оптимального уровня запаса.

В случае, если рассматривается функционирование системы за n периодов, причем спрос непостоянен, приходят к динамическим моделям управления запасами. Эти задачи, как правило, не поддаются аналитическому решению, однако оптимальные уровни запасов на каждый период можно вычислить, применив метод динамического программирования.

Рассматривается задача управления запасами, когда спрос за j-ый период (j=1,n) определяется величиной . Пусть – уровень запаса в начале j-го периода, а - объем пополнения запаса в этом периоде. Пополнение запасов осуществляется мгновенно в начале периода, дефицит продукции не разрешается. Графически условия задачи показаны на рис.1.

Пусть - общие затраты на хранение и пополнение на j-том периоде. Значение задано, а , т.к. в конце функционирования систем запас не нужен.

Требуется определить оптимальные объемы заказов в каждом периоде по критерию минимума суммарных затрат.

Математическая модель задачи будет иметь вид

здесь необходимо определить , которые удовлетворяли бы ограничениям (2)-(6) и минимизировали целевую функцию (1).

В этой модели целевая функция сепарабельная, ограничения (2) имеют рекуррентный вид. И эта особенность модели наталкивает на мысль о возможности применения для ее решения метода динамического программирования. Модель (1)-(6) отличается от стандартной модели динамического программирования наличием условия это условие можно преобразовать следующим образом. Из (2) и (3) следует, что , или можно записать

Тогда из (7) с учетом (4) определяется область возможных значений : или окончательно:

Таким образом, условие (3)-(4) заменяется условием (8), и модель (1),(2),(5)-(6),(8) имеет стандартный вид для метода динамического программирования.

В соответствии с методом динамического программирования решение этой задачи состоит из следующих этапов:

Иследует из ограничения (12)-(14).(j=2,n).

Проводится обратное движение алгоритма, в результате находятся оптимальные значения искомых переменных и . Минимальное значение целевой функции (1) определяется величиной