Реферат: "Принцип Максимума" Понтрягина - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

"Принцип Максимума" Понтрягина

Банк рефератов / Программирование

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Архив Zip, 186 kb, скачать бесплатно
Обойти Антиплагиат
Повысьте уникальность файла до 80-100% здесь.
Промокод referatbank - cкидка 20%!

Узнайте стоимость написания уникальной работы



Постановка задачи оптимального управления.

Состояние объекта управления характеризуется n -мерной вектор функцией, например, функцией времени

Так, шестимерная вектор-функция времени полностью определяет положение самолета как твердого тела в пространстве. Три координаты определяют положение центра масс, а три - вращение вокруг центра масс.

От управляющего органа к объекту управления поступает вектор-функция . Векторы x' и u' , обычно связаны между собой каким-то соотношением. Наиболее развитым в настоящее время является уравнение, в котором векторы связаны системой обыкновенных дифференциальных уравнений.

И так, пусть движение управляемого объекта описывается системой дифференциальных уравнений

(1.1)

где - вектор координат объекта или фазовых координат,
- заданная вектор-функция, - вектор управлений или просто управление.

В уравнении (1.1) векторы являются функциями переменной t, обозначающей время, причем, где - отрезок времени, на котором происходит управление системой.
На управление обычно накладывается условие

, (1.2)

где U(t) - заданное множество в при каждом .
Будем называть далее управлением кусочно-непрерывную на отрезке (т. е. имеющую конечное число разрывов первого рода) r--мерную вектор-функцию и, непрерывную справа в точках разрыва и непрерывную в точке Т. Управление и называется допустимым, если оно удовлетворяет ограничению (1.2).
Заметим, что ограничиться рассмотрением непрерывных управлений оказывается невозможным, так как с их помощью трудно моделировать моменты переключения управления такие, как, например, включение и отключение двигателей, отделение ступеней ракеты, поворот рулей и т. д.
Иногда рассматривают и более широкие классы допустимых управлений, например, класс всех ограниченных измеримых управлений, удовлетворяющих условию (1.2).
Покажем, как при произвольном начальном положении  и допустимом управлении и определяется траектория управляемого объекта. Рассмотрим задачу Коши

(1.3)

Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо, поясним, что понимается в данном случае под решением задачи (1.3). Для этого поступим следующим образом.

Пусть функция и имеет скачки в точках причем. Предположим, что задача (1.3) имеет решение х, определенное на всем отрезке [to,], причем . Далее рассмотрим задачу Коши

.

Предполагая, что она имеет решение на отрезке [] и ,приходим к задаче

и т. д.

Если функцию х удалось определить указанным способом на всем отрезке [to. Т], то будем называть ее решением задачи (1.3) или фазовой траекторией (иногда просто траекторией), соответствующей управлению и. Отметим, что x - непрерывная по построению функция, удовлетворяющая на отрезке равенству



При выполнении определенных условий на f решение задачи (1.3), соответствующее управлению и, существует и единственно при произвольном начальном положении и произвольном допустимом управлении и.

Помимо ограничения на управление могут существовать ограничения и на фазовые координаты

(1.4)

Ограничения на концах траектории целесообразно рассматривать отдельно:

(1.5)


здесь, S (Т) - заданные множества из R";
-заданные множества из R, причем inf < sup, to<.T.

Таким образом, начальный и конечный моменты времени не обязательно фиксированы. Случаю фиксированных to, Т соответствуют множества , , состоящие из одной точки; при этом говорят, что рассматривается задача с закрепленным временем.

Если So (to) = {} при любом ,то левый конец траектории называют закрепленным. Если же So (to) == R" при всех , то левый конец траектории называют свободным. Во всех остальных случаях левый конец называют подвижным. В аналогичных ситуациях говорят о закрепленном, свободном или подвижном правом конце траектории.

Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов.

Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)].

Наиболее часто под задачами управления понимаются задачи, в которых роль функционала выполняет интегральный функционал



Мы будем рассматривать задачу с целевым функционалом

(1.6)

представляющим собой сумму интегрального функционала 

и терминального

функционала Ф(х(Т), Т). Эта задача называется задачей Больца. Ее частными случаями являются задача с интегральным функционалом, называемая задачей Лагранжа, и задача с терминальным функционалом, называемая задачей Майера. Задача с интегральным функционалом при  называется задачей оптимального быстродействия.

Набор (to, Т, х, и, х), минимизирующий функционал (1.6), называется решением задачи оптимального управления, управление и - оптимальным управлением, а траектория х - оптимальной траекторией. Часто решением задачи оптимального управления называют пару (ц, х).








Принцип максимума Понтрягина.

Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина, представляющий собой необходимое условие оптимальности в таких задачах.

Формулировка принципа максимума.

Рассмотрим задачу оптимального управления, являющуюся частным случаем задачи, сформулированной выше

(2.1)
,
где (2.2)


При этом предполагается, что моменты to, Т фиксированы, т. е. рассматривается задача с закрепленным временем; множество U не зависит от времени, фазовые ограничения отсутствуют. Положим

,

где -константа,

Функция Н называется функцией Гамильтона.
Система линейных дифференциальных уравнений  относительно переменных называется сопряженной системой, соответствующей управлению и и траектории х. Здесь 

.

>В более подробной покоординатной записи сопряженная система принимает вид

, (2.3)

Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке .

Следующая теорема выражает необходимые условия оптимальности в задаче (2.1).

Теорема (принцип максимума Понтрягина).

Пусть функции и, Ф, g1, ..., gm имеют частные производные по переменным х1, ..., Хn и непрерывны вместе с этими производными по совокупности аргументов х , и  U, t [to. Т]. Предположим, что (и, х)-решение задачи (2.1). Тогда существует решение  сопряженной системы (2.3), соответствующей управлению и и траектории х, и константа  такие, что

|  | + || (t) || при t [to, Т], и выполняются следующие условия:

а) (условие максимума) при каждом t [to. Т] функция Гамильтона, достигает максимума по при v=u (t), т. е.

H(x(t), u(t),=max H(x(t), v(t), (2.4)

б)(условие трансверсальности на левом конце траектории) существуют числа, такие, что

(2.5)

в) (условие трансверсальности на правом конце траектории) существуют числа  такие, что

(2.6)

Центральным в теореме является условие максимума -(2.4).
Если отказаться от предположения о том, что конечный момент времени Т фиксирован, то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории. Условие (2.6) заменим условием



и добавить еще одно условие трансверсальности на правом конце траектории:



Примеры применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

(3.1)

где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию

.

Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

(3.2)

Начальное положение



при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид



Общее решение сопряженной системы



легко выписывается в явном виде  

где С, D - постоянные.

Очевидно, что максимум функции Н по и U достигается при



Таким образом, оптимальное управление и может принимать лишь два значения +1 .

2.Определить управление u(t) , которое дает минимум интегралу

, в процессе, описываемом уравнением (1).
Решение.
Введем дополнительную переменную

(2)

Для этой переменной имеем дифференциальное уравнение ( (3)

с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2), можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона



Запишем сопряженную систему  (3)

Запишем 

Y1(Т)=0 (т.к. с1=0)

Y2(Т)=-1

Из поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .

По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u : , , откуда .

Осталось решить систему уравнений (2) и (3) при условии  , Y2(Т)=-1,

,  с граничными условиями 

Сведем данную систему к одному уравнению относительно U.









Добавим к этому уравнению граничные условия  и решим его. Составим характеристическое уравнение к2 - (а2+1) =0, к1,2=+(-)



Найдем С1 и С2.  С2=-с2е. Тогда 

Используя граничные условия найдем С2

Таким образом, определено оптимальное решение









Примеры применения принципа максимума.

1. Простейшая задача оптимального быстродействия.

Пусть точка движется по прямой в соответствии с законом

(3.1)

где х - координата. Требуется найти управление и, переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия). При этом скорость точки в конце траектории должна быть нулевой, а управление - удовлетворять условию

.

Применим к сформулированной задаче принцип максимума Понтрягина . Введем фазовые переменные . Тогда движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка:

(3.2)

Начальное положение



при t0=0 и конечное положение (0, 0) фиксированы, а конечный момент времени Т не фиксирован.

В обозначениях п.п. 1, 2 в данной задаче U ==[-1, 1], f0=1, Ф=0, а функция Гамильтона имеет вид



Общее решение сопряженной системы



легко выписывается в явном виде  

где С, D - постоянные.

Очевидно, что максимум функции Н по и U достигается при



Таким образом, оптимальное управление и может принимать лишь два значения +1 .

2.Определить управление u(t) , которое дает минимум интегралу

, в процессе, описываемом уравнением (1).
Решение.
Введем дополнительную переменную

(2)

Для этой переменной имеем дифференциальное уравнение ( (3)

с начальными условиями, получаемыми из (2), т.е. х2(0)=0. Минимизирующий функционал, используя (2), можно записать в виде I[T]=x2(T).

Построим функцию Гамильтона



Запишем сопряженную систему  (3)

Запишем 

Y1(Т)=0 (т.к. с1=0)

Y2(Т)=-1

Из поэтому Y2(е)=-1. Теперь функция Гамильтона запишется в виде H=-aY1x1+Y1u-0,5x12-0,5u2 .

По принципу максимума функция Н при фиксированных х1 и Y1 достигает максимума по u : , , откуда .

Осталось решить систему уравнений (2) и (3) при условии  , Y2(Т)=-1,

,  с граничными условиями 

Сведем данную систему к одному уравнению относительно U.









Добавим к этому уравнению граничные условия  и решим его. Составим характеристическое уравнение к2 - (а2+1) =0, к1,2=+(-)



Найдем С1 и С2.  С2=-с2е. Тогда 

Используя граничные условия найдем С2

Таким образом, определено оптимальное решение











О методах решения задач оптимального управления

Убедимся вначале, что необходимые условия оптимальности в форме принципа максимума дают, вообще говоря, достаточную информацию для решения задачи оптимального управления (2.1), (2.2).

Условие максимума (2.4) позволяет, в принципе, найти управление и как функцию параметров х, t, 

(2.7)

Рассмотрим систему дифференциальных уравнений

(2.8)

объединяющюю систему уравнений движения объекта и сопряженную систему.

Как известно, общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка, зависит от 2п параметров. Кроме того, система необходимых условий оптимальности содержит т параметров и параметр y0. Таким образом, общее число неизвестных равно 2n+m+1.

Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений.

Легко понять, что, в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор () с точностью до положительного постоянного множителя. Поэтому если в конкретной задаче удается показать, что , то полагают обычно  == - 1. В противном случае накладывают какое-либо условие нормировки, например, 

Таким образом, общее число условий равно 2n+m+1 и совпадает с числом неизвестных параметров, что, в принципе, позволяет определить эти параметры. Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде.

Опишем численный метод, основанный на тех же соображениях. Для этого рассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями

(2.9)

Эта задача называется краевой задачей принципа максимума.

Задав произвольные начальные условияи решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х(Т),(Т). При этом на каждом шаге численного интегрирования значение  находится из решения вспомогательной оптимизационной задачи (2.7) (считаем, что параметр  задан и равен либо 0, либо -1).

Значения х (Г),  являются очевидно, некоторыми функциями от а и Ь:

). Решение краевой задачи принципа максимума сводится, таким образом, к решению полученной из (2.9), (2.5), (2.6) системы уравнений







Эта система содержит 2п+т неизвестных а, Ь,и состоит из 2п+т уравнений. Ее решение можно находить известными численными методами, например методом Ньютона.

Отметим, что вычисление значений весьма трудоемко, так как требует при каждом (а, b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов .

При реализации на ЭВМ методов решения задач оптимального управления, основанных на необходимых условиях экстремума, могут встретиться также значительные трудности, вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума. Это приводит к необходимости применения методов регуляризации, учета специфики конкретной решаемой задачи, ее физического смысла и т. п.

Другие численные методы, не связанные непосредственно с принципом максимума, основаны на редукции исходной задачи к некоторой конечномерной задаче математического программирования. Их называют иногда прямыми методами (впрочем, разделение вычислительных методов на прямые и непрямые довольно условно). Конечномерные аналоги задач оптимального управления имеют особенности, позволяющие эффективно применять некоторые методы нелинейного, динамического программирования и т. д]. Продемонстрируем пример такого подхода.





Рассмотрим следующую задачу оптимального управления





где моменты времени, Т фиксированы. Это задача более общего вида, чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида, которые, в частности, могут содержать ограничения на концах траектории вида (2.2).

Зафиксируем моменты времени  и заменим задачу (2.10) ее конечноразностным аналогом





Положив  задачу можно переписать в виде  (2.11)



Мы получили задачу математического программирования с переменными 

Задав начальное состояние х0 и управление (u0, u1, ..., uN-1), по формулам  легко вычислить траекторию ( х1, ..., хN). Тем самым (2.12) сводится к задаче с переменными х0, u0 , u1, ..., uN-1, и ее размерность, таким образом, оказывается равной n+Nr.

Для решения задачи (2.11) часто применяют метод динамического программирования. В данном случае этот метод выглядит следующим образом. Ввелем функцию где минимум берется по таким что(будем предполагать, что все фигурирующие здесь и ниже минимумы достигаются). Если множество таких наборов (uк, ..., uN-1) пусто, то значение ) не определено. Нетрудно видеть, что  (2.12)

где минимум берется по таким , что значение  определено.

Положив  и проводя вычисления по формулам (2.12) при k=N-1,N-2,...,0 можно найти решение задачи (2.11).

Действительно, пусть - значение управления, реализующее минимум в (2.12). Ясно, что значение задачи (2.11) , т.е. минимальное значение минимизирующей функции, равно , где минимум берется по таким , что значение  определено. Оптимальное управление и оптимальная траектория находятся, очевидно, по формулам

(2.13)

При численной реализации данного метода задаются сеточные аппроксимации множеств т.е. некоторые конечные множества Затем строятся множества , которые служат сеточными аппроксимациями интересующих нас подмножеств 

Далее по формулам (2.12) вычисляются значения для и т.д., причем при каждом k минимум в (2.12) берется по  После того как приближенно найдена точка , минимизирующая  решение задачи определяется формулами (2.13).













Заключение:

Отметим, что дискретные задачи оптимального управления встречаются на практике ( например, при описании импульсных систем) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач.

Задачи оптимизации управляемых процессов, или как они будут в дальнейшем называться, задачи оптимального управления, составляют один из широких классов экстремальных задач и имеют важное прикладное значение.

Структурная схема задачи управления состоит из двух звеньев: управляющего органа и объекта управления . В качестве объекта управления может служить, например, космический эксперимент, экономика отрасли промышленности, система машин, семейный бюджет и т. д. Управляющее звено со времени возникновения задач управления претерпело эволюции от простейшего регулятора до современной ЭВМ.



























Кыргызско - Российская Академия образования










Доклад



По дисциплине:

ТУТС



Тема: Принцип максимума Понтрягина.



Выполнил: Бахарев Д. В.ИВТ-1-98.

Проверила: Жданова С. В.




г. Бишкек 2001

6



1Авиация и космонавтика
2Архитектура и строительство
3Астрономия
 
4Безопасность жизнедеятельности
5Биология
 
6Военная кафедра, гражданская оборона
 
7География, экономическая география
8Геология и геодезия
9Государственное регулирование и налоги
 
10Естествознание
 
11Журналистика
 
12Законодательство и право
13Адвокатура
14Административное право
15Арбитражное процессуальное право
16Банковское право
17Государство и право
18Гражданское право и процесс
19Жилищное право
20Законодательство зарубежных стран
21Земельное право
22Конституционное право
23Конституционное право зарубежных стран
24Международное право
25Муниципальное право
26Налоговое право
27Римское право
28Семейное право
29Таможенное право
30Трудовое право
31Уголовное право и процесс
32Финансовое право
33Хозяйственное право
34Экологическое право
35Юриспруденция
36Иностранные языки
37Информатика, информационные технологии
38Базы данных
39Компьютерные сети
40Программирование
41Искусство и культура
42Краеведение
43Культурология
44Музыка
45История
46Биографии
47Историческая личность
 
48Литература
 
49Маркетинг и реклама
50Математика
51Медицина и здоровье
52Менеджмент
53Антикризисное управление
54Делопроизводство и документооборот
55Логистика
 
56Педагогика
57Политология
58Правоохранительные органы
59Криминалистика и криминология
60Прочее
61Психология
62Юридическая психология
 
63Радиоэлектроника
64Религия
 
65Сельское хозяйство и землепользование
66Социология
67Страхование
 
68Технологии
69Материаловедение
70Машиностроение
71Металлургия
72Транспорт
73Туризм
 
74Физика
75Физкультура и спорт
76Философия
 
77Химия
 
78Экология, охрана природы
79Экономика и финансы
80Анализ хозяйственной деятельности
81Банковское дело и кредитование
82Биржевое дело
83Бухгалтерский учет и аудит
84История экономических учений
85Международные отношения
86Предпринимательство, бизнес, микроэкономика
87Финансы
88Ценные бумаги и фондовый рынок
89Экономика предприятия
90Экономико-математическое моделирование
91Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
- Есть только один способ узнать вкус галстука – съесть его.
Бывший президент Грузии Михаил Саакашвили.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по программированию ""Принцип Максимума" Понтрягина", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2017
Рейтинг@Mail.ru