Главная страница  Системы автоматического управления 

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 [ 136 ] 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

Уравнение (14.776) означает, что (t) =--- . Полученный

их t~t2

ВЫВОД сформулируем в виде теоремы.

Теорема 14.5. Рассмотрим задачу нахождения оптимального управления * (О на интервале [t t,], которое минимизирует критерий Р {х (t, tz) для системы х = f (х, и, t). Предположим, что начальное состояние X (tj) = Xi задано и функция управления и (t) подчиняется ограничению типа неравенства (О , где U - постоянный вектор. Принцип максимума в этом случае формулируется относительно гамильтониана =

= фа/, где удвлетворяет векторному уравнению ib = - dHJdx с крае-

вым условием Ч (g) =-- .

Даже после формулировки теоремы 14.5 задача оптимизации по-прежнему связана с решением краевой задачи с закрепленными концами, как это можно видеть из следующего.

Пример 14.7. Найдем оптимальное управление и* (t) с учетом ограничения ы < 1, которое переводит объект управления с передаточной функцией 1/s из начала координат в точку X (Г) в течение интервала времени [О, Т] таким образом, чтобы расстояние от конечной точки X (Т) до области цели jCg бьшо минимальньш.

В формулировке Майера критерий качества определяется выражением

Р {X (Г) = {X, (Г) - xi) + {Х2 (Т) ~ х.,2Г.

Заметим, что задача имеет смысл только в том случае, если точка х не может быть достигнута за время меньшее или равное Т сек. Предположим, что это так. Используя теорему 14.5, имеем (опустив индекс а )

Я = ifiXa + ifau; il = 0; ijia =

*(0= sign №2(01-

Краевые условия будут: Xi (0) = X2 (0) =0;

1 (Т) =

дх, дР

dXf.

=-2[x,{T)-X2i];

=-21Х2(Т)-Х22].

Решение сопряженной системы, удовлетворяющее приведенньш выше краевым условиям, имеет вид

i(f)=2[x2i-x,{T)h XP2{t)=2lX22-X2(T)] + 2 [x2i-x,(T)]{T~t).

Сопряженный вектор зависит от неизвестных конечных значений вектора состояния. Ясно видно существование релейного решения. Поскольку конечный момент времени Т фиксирован, это дает нам представление о том, как следует решать задачу.

Предположим, например, что точка х лежит в первом квадранте и располагается вправо от траектории, которая исходит из начала координат и обусловлена управлением и = +1. Управление ы* (t) должно быть первоначально равно +1; кроме того, возможно самое большее одно переключение. Предположим, что ы* (t) = +1 для 0< t<i t, и и* {t) = -1 для t, f 1 Г. Тогда можно найти конечную точку оптимальной траектории х (Т) как функции от в интервале 0< Т с помощью уравнения системы и начального условиях (0) = 0. Затем, подставив полученное выражение для х* (Т) в критерий Р (х (Т), следует найти минимум этого выражения как функции от t,.

Подробные вьнисления предлагаем читателю проделать в качестве упражнений (см. задачу 14.11).

Когда мы пишем dP/dx, то это означает, что функция Р {х (t), получена исходя из функции вида Р (x(t), t).



Если область достижимых состояний G {Т) мойно йайти графически (предполагается, что рассматривается система второго порядка), то решение задачи управления конечным значением можно найти графически. Для объекта с двойным интегрирующим звеном зона G (Т) имеет вид, представленный на рис. 14.9. Радиус наибольшей окружности с центромв точке х, которая касается множества G (Т), определяет минимальное расстояние в момент времени t. Точка, в которой окружность и С (Т) касаются друг друга, представляет собой конечную точку оптимальной траектории. На рис. 14.9а и б приведены случаи, когда и* (t) соответственно не имеет ни одного переключения или имеет только одно переключение (почему?).

Заметим, что для линейной (даже нестационарной) системы форма и размеры G (t) не зависят от начальной точки х (покажите это). Это позволяет найти решение для широкого класса задач управления конечным состоянием.

14.7. РАСШИРЕНИЕ ОБЛАСТИ ПРИМЕНЕНИЯ ПРИНЦИПА МАКСИМУМА


Кратко остановимся на двух областях, в которых принцип максимума используется для решения задач необычного типа.

Рис. 14.9: а) Геометрия задачи из примера 14.7, в которой не требуется переключение управления и* ((); б) Геометрия задачи из примера 14.7, в которой требуется одно переключение управления и* (О

1. Задачи с ограничениями типа неравенства на переменные состояния

Иногда пространство состояний, в котором необходимо найти оптимальную траекторию, ограничивается замкнутым подпространством евклидова п-мерного пространства. Это ограничение определяется неравенством g (х) 0.

Если оптимальная траектория находится внутри ограниченного подпространства, то принцип максимума в том виде, в каком он приведен выше, удовлетворяется. Однако, если часть оптимальной траектории проходит по границе g- (л:) = О подпространства, то канонические уравнения необходимо модифицировать путем введения в них дополнительного члена. В точке, в которой оптимальная траектория соприкасается с границей g (х) = О, выполняется условие скачка для вектора if (t). Это условие скачка впервые доказал Р. В. Гамкрелидзе (см. работу [161]). На прак тике часто приходится сталкиваться с задачами, где наложены ограничения типа неравенств на фазовые координаты. Так, например, при осуществлении посадки реактивный самолет не должен снижаться ниже уровня поверхности Земли, а, как правило, антенны радиолокационных станций сопровождения имеют ограничения по скорости и ускорению, которые не позволяют им осуществлять сопровождение быстродвижущихся целей. В тех случаях, когда приходится иметь дело с подобными задачами, необходимо следить за тем, чтобы не нарушить соответствующие ограничения. . >



Один из возможных способов обойти упомянутые выше трудности снова сводится к использованию функций штрафов . Основной принцип использования функций штрафа применительно к ограничениям типа неравенства на управляющие воздействия был рассмотрен в гл. 13. Этот метод можно легко распространить на случай ограничения переменных состояния. В критерий, подлежащий минимизации, снова введем дополнительные члены, которые сильно возрастают при нарушении ограничений типа неравенств на переменные состояния. При соответствующем выборе функций штрафа следует ожидать, что решение будет близким к точному. Ряд результатов, указывающих на целесообразность использования метода функции штрафа, можно найти в работах [1721 и [1521.

2. Дифференциальные игры *

Интересным классом задач, применительно к которому можно иногда использовать принцип максимума, является класс, включающий в себя два ряда переменных управления (а иногда и две дифференциальные системы). Целью одного из рядов переменных управления (или системы) является минимизация какого-то определенного показателя, тогда как задача второго ряда сводится к максимизации этого показателя. В качестве конкретного примера рассмотрим задачу преследования эсминцем подводной лодки. В момент сбрасывания глубинных бомб эсминец должен находиться как можно ближе к подводной лодке, тогда как последняя - как можно дальше от эсминца.

Предположим, что эта составная система описывается векторным дифференциальным уравнением вида

x = f{x, и, V, о,

где и к V - переменные управления, располагаемые соответственно двумя сторонами. Далее, примем в данной задаче обычные виды краевых условий и ограничений. Рассмотрим показатель качества в форме Лагранжа

f =\ь{х,и, V, t) dt.

Предположим, что сторона А, контролирующая и (t), желает минимизировать показатель f, тогда как сторона Б, контролирующая v (t), стремится максимизировать тот же показатель. Если и Л и £ прекрасно осведомлены о местонахождении друг друга, то с точки зрения А обоснованная стратегия сводится к выбору такой и* (t), чтобы минимизировать f, несмотря на все усилия, предпринимаемые стороной Б. Это значит, что А стремится найти такое управление и* (t), что величина /* удовлетворяет условию

fi .

= min max L {х, и, V, t) dt. Последнее означает управление по минимаксному критерию.

* Дифференциальным играм посвящена работа [84]. Ввиду индивидуальной точки зрения автора этой работы и принятой им необычной системы обозначений читателю рекомендуем обратиться к исчерпывающему обзору, приведенному в книге [75].



1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111 112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127 128 129 130 131 132 133 134 135 [ 136 ] 137 138 139 140 141 142 143 144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159 160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175 176 177 178 179 180

© 2000 - 2024 ULTRASONEX-AMFODENT.RU.
Копирование материалов разрешено исключительно при условии цититирования.