Реферат: "Принцип Максимума" Понтрягина - текст реферата. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Реферат

"Принцип Максимума" Понтрягина

Банк рефератов / Программирование

Рубрики  Рубрики реферат банка

закрыть
Категория: Реферат
Язык реферата: Русский
Дата добавления:   
 
Скачать
Архив Zip, 186 kb, скачать бесплатно
Обойти Антиплагиат
Повысьте уникальность файла до 80-100% здесь.
Промокод referatbank - cкидка 20%!
Заказать
Узнать стоимость написания уникального реферата

Узнайте стоимость написания уникальной работы

17 Постановка задачи оптимального управления. Состояние объекта управле ния характеризуется n - мерной вектор функцией , например , функцией времени Так , шестимерная вектор - функция времени полностью определяет положение самолета как твердого тела в пространстве . Три координаты определяют положение центра масс , а три - вращение вокруг центра масс . От управляющего органа к объекту управления поступает вектор - функция . Векторы x' и u' , обычно связаны между собой каким - то соотношением . Наиболее развитым в настоящее время является уравнение , в котором векторы связаны системой обыкновенных дифференциальных уравнений . И так , пусть движение управляемого объекта описывается системой дифференциальных уравнений (1.1) где - вектор координат объекта или фазовых координат , - заданная вектор - функция , - вектор управлений или просто управление . В уравнении (1.1) векторы являются функциями переменной t, обозначающей время , причем , где - отрезок времени , на котором происходит управление системой . На управление обычно накладывается условие , (1.2) где U(t) - заданное множество в при каждом . Будем называть далее управлением кусочно - непрерывную на отрезке ( т . е . имеющую конечное число разрывов первого рода ) r-- мерную вектор - функцию и , непрерывную справа в точках разрыва и непрерывную в точке Т . Управление и называется допустимым , если оно удовлетворяет ограничению (1.2). Заметим , что ограничиться рассмотрением непрерывных управлений оказывается невозможным , так как с их помощью трудно моделировать моменты переключения управления такие , как , например , включение и отключение двигателей , отделение ступеней ракеты , поворот рулей и т . д . Иногда рассматривают и более широкие классы допустимых управлений , например , класс всех ограниченных измеримых управлений , удовлетворяющих условию (1.2). Покажем , как при произвольном начальном положении и допустимом управлении и определяется траектория управляемого объекта . Рассмотрим задачу Коши (1.3) Поскольку при разрывных правых частях классическое понятие решения системы дифференциальных уравнений неприменимо , поясним , что понимается в данном случае под решением задачи (1.3). Для этого поступим следующим образом . Пусть функция и имеет скачки в точках причем . Предположим , что задача (1.3) имеет решение х , определенное на всем отрезке [to, ], причем . Далее рассмотрим задачу Коши . Предполагая , что она имеет решение на отрезке [ ] и , приходим к задаче и т . д . Если функцию х удалось определить указанным способом на всем отрезке [to. Т ], то будем называть ее решением задачи (1.3) или фазовой траекторией ( иногда просто траекторией ), соответствующей управлению и . Отметим , что x - непрерывная по построению функция , удовлетворяющая на отрезке равенству При выполнении определенных условий на f решение задачи (1.3), соответствующее управлению и , существует и единственно при произвольном начальном положении и произвольном допустимом управлении и . Помимо ограничения на управление могут существовать ограничения и на фазовые координаты (1.4) Ограничения на концах траектории целесообразно рассматривать отдельно : (1.5) здесь , S ( Т ) - заданные множества из R"; - заданные множества из R, причем inf < sup , t o<.T. Таким образом , начальный и конечный моменты времени не обязательно фиксированы . Случаю фиксированных to, Т соответствуют множества , , состоящие из одной точки ; при этом говорят , что рассматривается задача с закрепленным временем . Если So (to) = при любом , то левый конец траектории называют закрепленным . Если же So (to) == R" при всех , то левый конец траектории называют свободным . Во всех остальных случаях левый конец называют подвижным . В аналогичных ситуациях говорят о закрепленном , свободном или подвижном правом конце траектории . Цель управления в задаче оптимального управления состоит в минимизации некоторого функционала на множестве допустимых наборов . Если каждой функции y=f(x) определенного класса ставится в соответствии по некоторому закону определенное числовое значение переменной I, то эту переменную называют функционалом от одной функциональной переменной I=I[y]=I[y(x)]=I[f(x)]. Наиболее часто под задачами управления понимаются задачи , в которых роль функционала выполняет интегральный функционал Мы будем рассматривать задачу с целевым функционалом (1.6) представляющим собой сумму интегрального функционала и терминального функционала Ф ( х ( Т ), Т ). Эта задача называется задачей Больца . Ее частными случаями являются задача с интегральным функционалом , называемая задачей Лагранжа , и задача с терминальным функционалом , называемая задачей Майера . Задача с интегральным функционалом при называется задачей оптимального быстродействия . Набор (to, Т , х , и , х ), минимизирующий функционал (1.6), называется решением задачи оптимального управления , управление и - оптимальным управлением , а траектория х - оптимальной траекторией . Часто решением задачи оптимального управления называют пару ( ц , х ). Принцип максимума Понтрягина. Эффективным средством исследования задач оптимального управления является принцип максимума Понтрягина , представляющий собой необходимое условие оптимальности в таких задачах . Формулировка принци па максимума. Рассмотрим задачу оптимального управления , являющуюся частным случаем задачи , сформулированной выше (2.1) , где (2.2) При этом предполагается , что моменты to, Т фиксированы , т . е . рассматривается задача с закрепленным временем ; множество U не зависит от време ни , фазовые ограничения отсутствуют . Положим , где -константа, Функция Н называется функцией Гамильтона. Система линейных дифференциальных уравнений относительно переменных называется сопряженной системой , соответствующей управлению и и траектории х. Здесь . >В более подробной покоординатной записи сопряженная система принимает вид , (2.3) Система (2.3) имеет при любых начальных условиях единственное решение , определенное и непрерывное на всем отрезке . Следующая теорема выражает необходимые условия оптимальности в задаче (2.1). Теорема ( принцип максимума Понтрягина ). Пусть функции и , Ф , g 1 , ..., gm имеют частные производные по переменным х 1 , ..., Х n и непрерывны вместе с этими производными по совокупности аргументов х , и U, t [to. Т ]. Предположим , что (и , х )-решение задачи (2. 1). Тогда существует решение сопряженной системы (2.3), соот ветствующей управлению и и траектории х , и константа такие , что | | + || (t) || при t [to, Т ], и выполняются следующие условия : а ) (условие максимума ) при каждом t [to. Т ] функция Гамильтона , достигает максимума по при v=u (t), т . е . H(x(t), u(t), =max H(x(t), v(t), (2.4) б ) (условие трансверс альности на левом конце траектории ) существуют числа , такие , ч то (2.5) в ) (условие трансверсальности на правом конце траект ории ) существуют числа такие , что (2.6) Центральным в теореме является условие максимума -(2.4). Если отказаться от пре дположения о том , что конечный момент времени Т фиксирован , то теорема останется справедливой за исключением условия трансверсальности на правом конце траектории . Условие (2.6) заменим условием и добавить еще одно условие трансверсальности на правом конце траектории : Примеры применения принципа максимума. 1. Простейшая задача оптимального быстродействия. Пусть точка движе тся по прямой в соответствии с законом (3.1) где х - координа та . Требуется найти управление и , переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия ). При этом скорость точки в конце траектории должна быть нулевой , а управление - удовлетворять условию . Применим к сформулированной задаче принцип максимума Понтр ягина . Введем фазовые переменные . Тогда движение управляемог о объекта описывается системой двух дифференциальных уравнений первого порядка : (3.2) Начальное положение при t 0 =0 и ко нечное положение (0, 0) фиксированы , а конечный момент времени Т не фиксирован . В обозначениях п.п . 1, 2 в данной задаче U ==[- 1, 1], f 0 =1, Ф =0, а функция Гамильтона имеет вид Общее решение сопряженной системы легко выписывается в явном виде где С, D - постоянные . Очевидно , что максимум функции Н по и U достигается при Таким образом , оптимальное управление и может принимать лишь два значения + 1 . 2 .Определить управление u(t) , которое дает минимум интегралу , в процессе , описываемом уравнением (1). Решение . Введем дополнительную переменную (2) Для этой переменной имеем дифференциальное уравнение ( (3) с начальными условиями , получаемыми из (2), т.е . х 2 (0)=0. Минимизирующий функционал , используя (2), можно записать в виде I[T]=x 2(T). Построим функцию Гамильтона Запишем сопряженную систему (3) Запишем Y 1 (Т )=0 (т.к . с 1=0) Y 2 (Т )=-1 Из поэтому Y 2 (е )=-1. Теперь фун кция Гамильтона запишется в виде H=-a Y 1x1+ Y 1u-0,5x1 2 -0,5u 2 . По принципу максимума функция Н при фиксированных х 1 и Y 1 достигает максимума по u : , , откуда . Осталось решить систему уравнений (2) и (3) при условии , Y 2 (Т )=-1, , с граничными условиями Сведем данную систему к одному уравнению относительно U. Добавим к этому уравнению граничные условия и решим его . Составим характеристическое уравнение к 2 - (а 2 +1) =0, к 1,2=+(-) Найдем С 1 и С 2. С 2 =-с 2 е . Тогда Используя граничные условия найдем С 2 Таким образом , определено оптимальное решение Примеры применения принципа максимума. 1. Простейшая задача оптимального быстродейств ия. Пусть точка движется по прямой в соответствии с законом (3.1) где х - координата . Требуется найти управление и , переводящее точку из начального положения в начало координат за минимальное время Т (задача оптимального быстродействия ). При этом скорость точки в конце траектории должна быть нулевой , а управление - удовлетворять условию . Применим к сформулированной задаче п ринцип максимума Понтрягина . Введем фазовые переменные . Тогд а движение управляемого объекта описывается системой двух дифференциальных уравнений первого порядка : (3.2) Начальное положение при t 0 =0 и конечное положение (0, 0) фиксированы , а конечный момент времени Т не фиксирован . В обозначениях п.п . 1, 2 в данной задаче U ==[- 1, 1], f 0 =1, Ф =0, а функция Гамильтона имеет вид Общее решение сопряженной системы легко выписывается в явном виде где С, D - постоянные . Очевидно , что максимум функции Н по и U достигается при Таким образом , оптимальное управление и может принимать лишь два значения + 1 . 2 .Определить управление u(t) , которое дает минимум интегралу , в процессе , описываемом уравнением (1). Решение . Введем дополнительную переменную (2) Для этой переменной имеем дифференциальное уравнение ( (3) с начальными условиями , получаемыми из (2), т.е . х 2 (0)=0. Минимизирующий функционал , используя (2), можно записать в виде I[T]=x 2(T). Построим функцию Гамильтона Запишем сопряженную систему (3) Запишем Y 1 (Т )=0 (т.к . с 1=0) Y 2 (Т )=-1 Из поэтому Y 2 (е )=-1. Теперь функция Гамильтона запишется в виде H=-a Y 1x1+ Y 1u-0,5x1 2 -0,5u 2 . По принципу максимума функция Н при фиксированных х 1 и Y 1 достигает максимума по u : , , откуда . Осталось решить систему уравнений (2) и (3) при условии , Y 2 (Т )=-1, , с граничными условиями Сведем данную систему к одному уравнению относительно U. Добавим к этому уравнению граничные условия и решим его . Составим характеристическое уравнение к 2 - (а 2 +1) =0, к 1,2=+(-) Найдем С 1 и С 2. С 2 =-с 2 е . Тогда Используя граничные условия найд ем С 2 Таким образом , определено оптимальное решение О методах решения задач оптимального управления Убедимс я вначале , что необходимые условия оптимальности в форме принципа максимума дают , вообще говоря , достаточную информацию для решения задачи оптимального управления (2.1), (2.2). Условие максимума (2.4) позволяет , в принципе , найти управление и как функцию параметров х , t, (2.7) Рассмотрим систему дифференциальных уравнений (2.8) объединяющюю систему уравнений движения объекта и сопряженную систему . Как известно , общее решение системы (2.8), состоящей из 2n обыкновенных дифференциальных уравнений первого порядка , зависит от 2п параметров . Кроме того , система необходимых условий оптимальности содержит т параметров и параметр y 0 . Таким образом , общее число неизвестных равно 2n+m+1. Для их определения мы имеем 2п условий (2.5), (2.6) и т условий (2.2). Еще одно условие определяется из следующих соображений . Легко понять , что , в силу линейности функции Н по переменным принцип максимума Понтрягина определяет вектор ( ) с точностью до положительного постоянного множителя . Поэтому если в конкретной задаче удается показать , что , то полагают обычно == - 1. В противном случае накладывают какое-либо условие нормировки , например, Таким образом , общее число условий равно 2n+m+1 и совпадает с числом неизв естных параметров , что , в принципе , позволяет определить эти параметры . Изложенные соображения дают возможность в простейших случаях решить задачу оптимального управления в явном виде . Опишем численный метод , основанный на тех же соображениях . Для этого р ассмотрим краевую задачу для системы дифференциальных уравнений (2.8) с краевыми условиями (2.5), (2.6), а также выписанными на основе (2.2) краевыми условиями (2.9) Эта задача называется краевой задачей принципа максимума. Задав произвольные начальные условия и решив каким-либо численным методом задачу Коши для системы (2.8), можно найти х (Т ), (Т ). При этом на каждом шаге численного интегрирования значение находится из решения вспомогательной оптимизационной задачи (2.7) (считаем , что п араметр задан и равен либо 0, либо -1). Значения х (Г ), являются очевидно , некоторыми функциями от а и Ь : ). Решение краевой задачи принципа максимума сводится , таким образом , к решению полученной из (2.9), (2.5), (2.6) системы уравнений Эта система содержит 2п +т неизвестных а , Ь, и состоит из 2п +т уравнений . Ее решение можно находить известными численными методами , например методом Ньютона . Отметим , что в ычисление значений весьма трудоемко , так как требует при ка ждом (а , b) решения задачи Коши для системы дифференциальных уравнений (2.8). Именно в таких случаях особое значение приобретает изучение вопросов эффективности численных методов и построения оптимальных методов . При реализации на ЭВМ методов решения зад ач оптимального управления , основанных на необходимых условиях экстремума , могут встретиться также значительные трудности , вызванные некорректностью постановки исходной и вспомогательных задач и некоторыми особенностями краевой задачи принципа максимума . Э то приводит к необходимости применения методов регуляризации , учета специфики конкретной решаемой задачи , ее физического смысла и т . п . Другие численные методы , не связанные непосредственно с принципом максимума , основаны на редукции исходной задачи к нек оторой конечномерной задаче математического программирования . Их называют иногда прямыми методами (впрочем , разделение вычислительных методов на прямые и непрямые довольно условно ). Конечномерные аналоги задач оптимального управления имеют особенности , поз воляющие эффективно применять некоторые методы нелинейного , динамического программирования и т . д ]. Продемонстрируем пример такого подхода . Рассмотрим следующую задачу оптимального управления где моменты времени , Т фиксированы . Это задача более общего вида , чем (2.1), ибо в (2.10) U зависит от времени и имеются фазовые ограничения произвольного вида , которые , в частности , могут содержать ограничения на концах траектории вида (2.2). Зафиксируем моменты времени и заменим задачу (2.10) ее конечноразностным аналогом Положив задачу можно переписать в виде (2.11) Мы получили задачу математического программирования с переменными Задав начальное состояние х 0 и управление (u 0 , u 1 , ..., u N-1 ), по формулам легко вычислить траекторию ( х 1, ..., х N) . Тем самым (2.12) сводится к задаче с переменными х 0, u0 , u1, ..., uN-1 , и ее размерность , таким образом , оказывается равной n+Nr. Для решения задачи (2.11) часто применяют метод дина мического программирования . В данном случае этот метод выглядит следующим образом . Ввелем функцию где минимум берется по таким что (будем предполагать , что все фигурирующие здесь и ниже минимумы достигаются ). Если множество таких наборов (u к , ..., u N-1 ) пусто , то значение ) не определено . Нетрудно видеть , что (2.12) где минимум берется по таким , что значение определено . Положив и проводя вычисления по формулам (2.12) при k=N-1,N-2,...,0 можно найти решение задачи (2.11). Действительно , пусть - значение управления , реализующее минимум в (2.12). Ясно , что значение задачи (2.11) , т.е . минимальное значение минимизирующей функции , равно , где минимум берется по таким , что значение определено . Оптимальное управление и оптимальная траектория находятся , очевидно , по формулам (2.13) При численной реализации данного метода задаются сеточные аппроксимации множеств т.е . некоторые конечные множества Затем строятся множества , которые служат сеточными аппроксимациями интересующих нас подмножеств Далее по формулам (2.12) вычисляются значения для и т.д ., причем при каждом k минимум в (2.12) берется по После того как приближенно найдена точка , минимизирующая решение задачи определяется формулами (2.13). Заключение : Отметим , что дискретные задачи оптимального управления вст речаются на практике ( например , при описании импульсных систем ) и потому представляют интерес не только как конечноразностные аналоги непрерывных задач . Задачи оптимизации управляемых процессов , или как они будут в дальнейшем называться , задачи оптимальн ого управления , составляют один из широких классов экстремальных задач и имеют важное прикладное значение . Структурная схема задачи управления состоит из двух звеньев : управляющего органа и объекта управления . В качестве объекта управления может служить, например , космический эксперимент , экономика отрасли промышленности , система машин , семейный бюджет и т . д . Управляющее звено со времени возникновения задач управления претерпело эволюции от простейшего регулятора до современной ЭВМ. Кыргызско - Российская Академия образования Доклад По дисциплине : ТУТС Тема : Принцип максимума Понтрягина. Выполнил : Бахарев Д . В.ИВТ -1-98. Проверила : Жданова С . В. г . Бишкек 2001
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
Если Снегурочка после второго стакана водки говорит, что ей жарко, значит, она настоящая.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, реферат по программированию ""Принцип Максимума" Понтрягина", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2017
Рейтинг@Mail.ru