Реферат: "Принцип Максимума" Понтрягина - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

"Принцип Максимума" Понтрягина

Банк рефератов / Программирование

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Архив Zip, 186 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

17 Постановка задачи оптимального управления. Состояние объекта управле ния характеризуется n - мерной вектор функцией , например , функцией времени Так , шестимерная вектор - функция времени полностью определяет положение самолета как твердого тела в пространстве . Три координаты определяют положение центра масс , а три - вращение вокруг центра масс . От управляющего органа к объекту управления поступает вектор - функция . Векторы x' и u' , обычно связаны между собой каким - то соотношением . Наиболее развитым в настоящее время является уравнение , в котором векторы связаны системой обыкновенных дифференциальных уравнений . И так , пусть движение управляемого объекта описывается системой дифференциальных уравнений (1.1) где - вектор координат объекта или фазовых координат , - заданная вектор - функция , - вектор управлений или просто управление . В уравнении (1.1) векторы являются функциями переменной t, обозначающей время , причем , где - отрезок времени , на котором происходит управление системой . На управление обычно накладывается условие , (1.2) где U(t) - заданное множество в при каждом . Будем называть далее управлением кусочно - непрерывную на отрезке ( т . е . имеющую конечное число разрывов первого рода ) r-- мерную вектор - функцию и , непрерывную справа в точках разрыва и непрерывную в точке Т . Управление и называется допустимым , если оно удовлетворяет ограничению (1.2). Заметим , что ограничиться рассмотрением непрерывных управлений оказывается невозможным , так как с их помощью трудно моделировать моменты переключения управления такие , как , например , включение и отключение двигателей , отделение ступеней ракеты , поворот рулей и т . д . Иногда рассматривают и более широкие классы допустимых управлений , например , класс всех ограниченных измеримых управлений , удовлетворяющих условию (1.2). Покажем , как при произвольном начальном положении и допустимом управлении и определяется траектория управляемого объекта . Рассмотрим задачу Коши (1.3) Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо , поясним , что понимается в данном случае под решением задачи (1.3). Для этого поступим следующим образом . Пусть функция и имеет скачки в точках причем . Предположим , что задача (1.3) имеет решение х , определенное на всем отрезке [to, ], причем . Далее рассмотрим задачу Коши . Предполагая , что она имеет решение на отрезке [ ] и , приходим к задаче и т . д . Если функцию х удалось определить указанным способом на всем отрезке [to. Т ], то будем называть ее решением задачи (1.3) или фазовой траекторией ( иногда просто траекторией ), соответствующей управлению и . Отметим , что x - непрерывная по построению функция , удовлетворяющая на отрезке равенству При выполнении определенных условий на f решение задачи (1.3), соответствующее управлению и , существует и единственно при произвольном начальном положении и произвольном допустимом управлении и . Помимо ограничения на управление могут существовать ограничения и на фазовые координаты (1.4) Ограничения на концах траектории целесообразно рассматривать отдельно : (1.5) здесь , S ( Т ) - заданные множества из R"; - заданные множества из R, причем inf < sup , t o<.T. Таким образом , начальный и конечный моменты времени не обязательно фиксированы . Случаю фиксированных to, Т соответствуют множества , , состоящие из одной точки ; при этом говорят , что рассматривается задача с закрепленным временем . Если So (to) = при любом , то левый конец траектории называют закрепленным . Если же So (to) == R" при всех , то левый конец траектории называют свободным . Во всех остальных случаях левый конец называют подвижным . В аналогичных ситуациях говорят о закрепленном , свободном или подвижном правом конце траектории . Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов . Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)]. Наиболее часто под задачами управления понимаются задачи , в которых роль функционала выполняет интегральный функционал Мы будем рассматривать задачу с целевым функционалом (1.6) представляющим собой сумму интегрального функционала и терминального функционала Ф ( х ( Т ), Т ). Эта задача называется задачей Больца . Ее частными случаями являются задача с интегральным функционалом , называемая задачей Лагранжа , и задача с терминальным функционалом , называемая задачей Майера . Задача с интегральным функционалом при называется задачей оптимального быстродействия . Набор (to, Т , х , и , х ), минимизирующий функционал (1.6), называется решением задачи оптимального управления , управление и - оптимальным управлением , а траектория х - оптимальной траекторией . Часто решением задачи оптимального управления называют пару ( ц , х ). Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина , представляющий собой необходимое условие оптимальности в таких задачах . Формулировка принци па максимума. Рассмотрим задачу оптимального управления , являющуюся частным случаем задачи , сформулированной выше (2.1) , где (2.2) При этом предполагается , что моменты to, Т фиксированы , т . е . рассматривается задача с закрепленным временем ; множество U не зависит от време ни , фазовые ограничения отсутствуют . Положим , где -константа, Функция Н называется функцией Гамильтона. Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой , соответствующей управлению и и траектории х. Здесь . >В более подробной покоординатной записи сопряженная система принимает вид , (2.3) Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке . Следующая теорема выражает необходимые условия оптимальности в задаче (2.1). Теорема ( принцип максимума Понтрягина ). Пусть функции и , Ф , g 1 , ..., gm имеют частные производные по переменным х 1 , ..., Х n и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т ]. Предположим , что (и , х )-решение задачи (2. 1). Тогда существует решение сопряженной системы (2.3), соот ветствующей управлению и и траектории х , и константа такие , что | | + || (t) || при t [to, Т ], и выполняются следующие условия : а ) (условие максимума ) при каждом t [to. Т ] функция Гамильтона , достигает максимума по при v=u (t), т . е . H(x(t), u(t), =max H(x(t), v(t), (2.4) б ) (условие трансверс альности на левом конце траектории ) существуют числа , такие , ч то (2.5) в ) (условие трансверсальности на правом конце траект ории ) существуют числа такие , что (2.6) Центральным в теореме является условие максимума -(2.4). Если отказаться от пре дположения о том , что конечный момент времени Т фиксирован , то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории . Условие (2.6) заменим условием и добавить еще одно условие трансверсальности на правом конце траектории : Примеры применения принципа максимума. 1. Простейшая задача оптимального быстродействия. Пусть точка движе тся по прямой в соответствии с законом (3.1) где х - координа та . Требуется найти управление и , переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия ). При этом скорость точки в конце траектории должна быть нулевой , а управление - удовлетворять условию . Применим к сформулированной задаче принцип максимума Понтр ягина . Введем фазовые переменные . Тогда движение управляемог о объекта описывается системой двух дифференциальных уравнений первого порядка : (3.2) Начальное положение при t 0 =0 и ко нечное положение (0, 0) фиксированы , а конечный момент времени Т не фиксирован . В обозначениях п.п . 1, 2 в данной задаче U ==[- 1, 1], f 0 =1, Ф =0, а функция Гамильтона имеет вид Общее решение сопряженной системы легко выписывается в явном виде где С, D - постоянные . Очевидно , что максимум функции Н по и U достигается при Таким образом , оптимальное управление и может принимать лишь два значения + 1 . 2 .Определить управление u(t) , которое дает минимум интегралу , в процессе , описываемом уравнением (1). Решение . Введем дополнительную переменную (2) Для этой переменной имеем дифференциальное уравнение ( (3) с начальными условиями , получаемыми из (2), т.е . х 2 (0)=0. Минимизирующий функционал , используя (2), можно записать в виде I[T]=x 2(T). Построим функцию Гамильтона Запишем сопряженную систему (3) Запишем Y 1 (Т )=0 (т.к . с 1=0) Y 2 (Т )=-1 Из поэтому Y 2 (е )=-1. Теперь фун кция Гамильтона запишется в виде H=-a Y 1x1+ Y 1u-0,5x1 2 -0,5u 2 . По принципу максимума функция Н при фиксированных х 1 и Y 1 достигает максимума по u : , , откуда . Осталось решить систему уравнений (2) и (3) при условии , Y 2 (Т )=-1, , с граничными условиями Сведем данную систему к одному уравнению относительно U. Добавим к этому уравнению граничные условия и решим его . Составим характеристическое уравнение к 2 - (а 2 +1) =0, к 1,2=+(-) Найдем С 1 и С 2. С 2 =-с 2 е . Тогда Используя граничные условия найдем С 2 Таким образом , определено оптимальное решение Примеры применения принципа максимума. 1. Простейшая задача оптимального быстродейств ия. Пусть точка движется по прямой в соответствии с законом (3.1) где х - координата . Требуется найти управление и , переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия ). При этом скорость точки в конце траектории должна быть нулевой , а управление - удовлетворять условию . Применим к сформулированной задаче п ринцип максимума Понтрягина . Введем фазовые переменные . Тогд а движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка : (3.2) Начальное положение при t 0 =0 и конечное положение (0, 0) фиксированы , а конечный момент времени Т не фиксирован . В обозначениях п.п . 1, 2 в данной задаче U ==[- 1, 1], f 0 =1, Ф =0, а функция Гамильтона имеет вид Общее решение сопряженной системы легко выписывается в явном виде где С, D - постоянные . Очевидно , что максимум функции Н по и U достигается при Таким образом , оптимальное управление и может принимать лишь два значения + 1 . 2 .Определить управление u(t) , которое дает минимум интегралу , в процессе , описываемом уравнением (1). Решение . Введем дополнительную переменную (2) Для этой переменной имеем дифференциальное уравнение ( (3) с начальными условиями , получаемыми из (2), т.е . х 2 (0)=0. Минимизирующий функционал , используя (2), можно записать в виде I[T]=x 2(T). Построим функцию Гамильтона Запишем сопряженную систему (3) Запишем Y 1 (Т )=0 (т.к . с 1=0) Y 2 (Т )=-1 Из поэтому Y 2 (е )=-1. Теперь функция Гамильтона запишется в виде H=-a Y 1x1+ Y 1u-0,5x1 2 -0,5u 2 . По принципу максимума функция Н при фиксированных х 1 и Y 1 достигает максимума по u : , , откуда . Осталось решить систему уравнений (2) и (3) при условии , Y 2 (Т )=-1, , с граничными условиями Сведем данную систему к одному уравнению относительно U. Добавим к этому уравнению граничные условия и решим его . Составим характеристическое уравнение к 2 - (а 2 +1) =0, к 1,2=+(-) Найдем С 1 и С 2. С 2 =-с 2 е . Тогда Используя граничные условия найд ем С 2 Таким образом , определено оптимальное решение О методах решения задач оптимального управления Убедимс я вначале , что необходимые условия оптимальности в форме принципа максимума дают , вообще говоря , достаточную информацию для решения задачи оптимального управления (2.1), (2.2). Условие максимума (2.4) позволяет , в принципе , найти управление и как функцию параметров х , t, (2.7) Рассмотрим систему дифференциальных уравнений (2.8) объединяющюю систему уравнений движения объекта и сопряженную систему . Как известно , общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка , зависит от 2п параметров . Кроме того , система необходимых условий оптимальности содержит т параметров и параметр y 0 . Таким образом , общее число неизвестных равно 2n+m+1. Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений . Легко понять , что , в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор ( ) с точностью до положительного постоянного множителя . Поэтому если в конкретной задаче удается показать , что , то полагают обычно == - 1. В противном случае накладывают какое-либо условие нормировки , например, Таким образом , общее число условий равно 2n+m+1 и совпадает с числом неизв естных параметров , что , в принципе , позволяет определить эти параметры . Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде . Опишем численный метод , основанный на тех же соображениях . Для этого р ассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями (2.9) Эта задача называется краевой задачей принципа максимума. Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х (Т ), (Т ). При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем , что п араметр задан и равен либо 0, либо -1). Значения х (Г ), являются очевидно , некоторыми функциями от а и Ь : ). Решение краевой задачи принципа максимума сводится , таким образом , к решению полученной из (2.9), (2.5), (2.6) системы уравнений Эта система содержит 2п +т неизвестных а , Ь, и состоит из 2п +т уравнений . Ее решение можно находить известными численными методами , например методом Ньютона . Отметим , что в ычисление значений весьма трудоемко , так как требует при ка ждом (а , b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов . При реализации на ЭВМ методов решения зад ач оптимального управления , основанных на необходимых условиях экстремума , могут встретиться также значительные трудности , вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума . Э то приводит к необходимости применения методов регуляризации , учета специфики конкретной решаемой задачи , ее физического смысла и т . п . Другие численные методы , не связанные непосредственно с принципом максимума , основаны на редукции исходной задачи к нек оторой конечномерной задаче математического программирования . Их называют иногда прямыми методами (впрочем , разделение вычислительных методов на прямые и непрямые довольно условно ). Конечномерные аналоги задач оптимального управления имеют особенности , поз воляющие эффективно применять некоторые методы нелинейного , динамического программирования и т . д ]. Продемонстрируем пример такого подхода . Рассмотрим следующую задачу оптимального управления где моменты времени , Т фиксированы . Это задача более общего вида , чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида , которые , в частности , могут содержать ограничения на концах траектории вида (2.2). Зафиксируем моменты времени и заменим задачу (2.10) ее конечноразностным аналогом Положив задачу можно переписать в виде (2.11) Мы получили задачу математического программирования с переменными Задав начальное состояние х 0 и управление (u 0 , u 1 , ..., u N-1 ), по формулам легко вычислить траекторию ( х 1, ..., х N) . Тем самым (2.12) сводится к задаче с переменными х 0, u0 , u1, ..., uN-1 , и ее размерность , таким образом , оказывается равной n+Nr. Для решения задачи (2.11) часто применяют метод дина мического программирования . В данном случае этот метод выглядит следующим образом . Ввелем функцию где минимум берется по таким что (будем предполагать , что все фигурирующие здесь и ниже минимумы достигаются ). Если множество таких наборов (u к , ..., u N-1 ) пусто , то значение ) не определено . Нетрудно видеть , что (2.12) где минимум берется по таким , что значение определено . Положив и проводя вычисления по формулам (2.12) при k=N-1,N-2,...,0 можно найти решение задачи (2.11). Действительно , пусть - значение управления , реализующее минимум в (2.12). Ясно , что значение задачи (2.11) , т.е . минимальное значение минимизирующей функции , равно , где минимум берется по таким , что значение определено . Оптимальное управление и оптимальная траектория находятся , очевидно , по формулам (2.13) При численной реализации данного метода задаются сеточные аппроксимации множеств т.е . некоторые конечные множества Затем строятся множества , которые служат сеточными аппроксимациями интересующих нас подмножеств Далее по формулам (2.12) вычисляются значения для и т.д ., причем при каждом k минимум в (2.12) берется по После того как приближенно найдена точка , минимизирующая решение задачи определяется формулами (2.13). Заключение : Отметим , что дискретные задачи оптимального управления вст речаются на практике ( например , при описании импульсных систем ) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач . Задачи оптимизации управляемых процессов , или как они будут в дальнейшем называться , задачи оптимальн ого управления , составляют один из широких классов экстремальных задач и имеют важное прикладное значение . Структурная схема задачи управления состоит из двух звеньев : управляющего органа и объекта управления . В качестве объекта управления может служить, например , космический эксперимент , экономика отрасли промышленности , система машин , семейный бюджет и т . д . Управляющее звено со времени возникновения задач управления претерпело эволюции от простейшего регулятора до современной ЭВМ. Кыргызско - Российская Академия образования Доклад По дисциплине : ТУТС Тема : Принцип максимума Понтрягина. Выполнил : Бахарев Д . В.ИВТ -1-98. Проверила : Жданова С . В. г . Бишкек 2001
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
- Слушайте, я кроме двух порций шашлыка ничего не заказывал! Почему же вы мне принесли счет аж на тысячу долларов?!
- Шашлык приготовлен на олимпийском огне!
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по программированию ""Принцип Максимума" Понтрягина", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru