Курсовая: Военные игры. Игры преследования - текст курсовой. Скачать бесплатно.
Банк рефератов, курсовых и дипломных работ. Много и бесплатно. # | Правила оформления работ | Добавить в избранное
 
 
   
Меню Меню Меню Меню Меню
   
Napishem.com Napishem.com Napishem.com

Курсовая

Военные игры. Игры преследования

Банк рефератов / Математика

Рубрики  Рубрики реферат банка

закрыть
Категория: Курсовая работа
Язык курсовой: Русский
Дата добавления:   
 
Скачать
Архив Zip, 29 kb, скачать бесплатно
Заказать
Узнать стоимость написания уникальной курсовой работы

Узнайте стоимость написания уникальной работы

12 Министерство обр азования , здравоохранения и культуры Республики Каза хстан ВУЗ АВИЭК Кафедра ЭВМ Курсовая работа По дисциплине : “Теория принятия решений” Тема : “Военные игры . Игры преследования.” Выполнил : Ст-т гр ЗПОС -96-1 Гринев М.В. Принял : Доцент , к.ф.-м.н. Пшенин Е.С. Алматы 2000г. Введение. Когда собака гонится за кроли ком , то даже если она все время видит его , она не знает его дальнейшего пов едения и может руководствоваться только знани ем физических возможностей кролика и своих собственных . Таково своеобразие задачи преследо вания одного упр авляемого объекта другим управляемым объектом , математическому описанию которой посвящена данная работа . Конечно , зд есь речь пойдет не о животных , а о технических объектах , но у этих объектов предполагается некоторая свобода действий , анал огичная свободе в оли животных . Заран ее нужно сказать , что рассматриваемые в р аботе технические объекты чрезвычайно элементарн ы , и весь вопрос ввиду его новизны нах одится на очень низком уровне развития . В работе рассматриваются игры , в которых уч аствуют два игрока : убег а ющий и преследующий . Такие игры преследования называют ся дифференциальными потому , что в них пов едение обоих игроков описывается дифференциальны ми уравнениями. Фазовые координа ты и управления. Типичными примерами дифференциальных игр являются сражен ия , воздушные бои , преследование судна то рпедой , перехват самолета зенитной ракетой , ох рана объектов . Если один из игроков выключ ается из игры , мы получаем обычную задачу максимизации . Она уже относится к вариац ионному исчислению и составляет основную част ь т еории управления. Решения игроков всегда заключаются в выборе некоторых величин , наз ываемых управлениями. Они в свою очередь определяют собо й значения других величин – фазовых координат . Последние обладают тем свойством , сто знание их значений в любой мом ент времени по лностью определяет течение игры. Военные игры. Фазовые координаты должны быть такими величинами , которые характеризуют положе ние дел в той мере , в какой по нео бходимости упрощенная модель задачи соответствуе т реальному процессу . Фазовыми к оордината ми могут , в частности , быть число людей , самолетов , танков , судов ; может оказаться це лесообразным разделить их на группы по ра сположению в различных районах или по как ому-либо другому признаку , например по удаленн ости от линии фронта и т.д. Пуст ь армия 1 – “минимизирующая” - имеет в своем распоряжении управления…… ; соответственно армия 2 – “максимизирующая” - имеет управления ……… . Вы бор управлений часто обусловлен обстоятельствами . Предположим , например , что платой является разница в живой силе ( и ли сна ряжении и т.п .) в конце игры или в ф иксированный момент времени Т . Пусть x 1 – соответствующая координата I -той армии , тогда плата равна x 2 – x 1 . Механизм развития подобной игры лучше всего продемонстрировать на к онкретных примерах. Пусть x 1 – колич ество живо й силы армии 1 в некотором секторе ; это количество может уменьшаться за счет воздушны х налетов противника . Пусть x 3 – число самолетов армии 2 (противника ), которые можно использовать для этой цели через . Через 1 обозн ачим (<= 1 <=1) обозначим долю об щего числа самолетов x 3 , которую противник решает использовать в некоторый момент време ни . Теперь нужно из опыта или каким-либо другим образом определить , как ожидаемые по тери в живой силе зави сят от числ а 1 x 3 п осланных самолетов противника . Пусть они прям опропорциональны 1 x 3 и коэффициент пропорциональности раве н C . Для того чтобы иметь возможность исп ользовать мощный аппарат мате матического анализа , будем предполагать , что процесс являе тся не дискретным , а непрерывным . Это дает непрерывную аппроксимацию дискретной игры. Представим , что армия 1 получает пополнени е с фиксированной скоростью r . Тогда имеем уравнение X ` 1 = r - c 1 x 3 +… (1) Многоточие в правой части уравнения о значает различные другие члены , как , например , изменения в результате других действий а рмии 2 или маневрирования живой силой армии 1. если игра полностью симметрична , то имеем такое же уравнение , только армии ме няются ролями. Пусть x 4 – запас военного снар яжения армии 1, который служит для ее снабж ения . Пусть b - максимальная скорость такого снабжения . Пусть 1 (0<= 1 <=1) - доля от b , которую армия 1 решает и спользовать в данный момент . Тогда X ` 4 = - b 1 . (2) При определении пространства со стояний E мы будем требовать , чтобы выполнялось условие x 4 0. тогда (2 ) предс тавляет собой ограничение на использование эт ого запаса и дает игроку возможность расп оряжаться этим запасом с учетом его огран иченности. В левых частях уравнений (1) и (2) стоят обычные производные от координат по врем ени . Уравнения такого типа сл ужат осно вным средством описания развития дифференциально й игры . Они называются уравнениями движения и имеют вид : X ` м = f i ( x 1 ,… x n , i ,… , n , n … n ), I =1,… n (3) Итак , скорость изменения фазовых координат является заданной функцией от фазовых координат и управлений обоих игроков. Игры с движу щимся объектом. Возьмем в качестве примера движ ущегося объекта автомобиль и рассмотрим при этом уравнение движения , фазовые коорди наты , управления и различия между последними . Автомобиль выбран потому , что его свойст ва общеизвестны . Рассуждения можно применить , лишь с малыми изменениями , к любому движущ емуся объекту . Летательные а ппараты движутся в трехмерном пространстве , но принци п остается тот же. Геометрическое положение объекта , например автомобиля , описывается тремя фазовыми координа тами : x 1 , x 2 – декартовы координаты некоторой фиксированной точки автомобиля и x 3 – угол , обра зуемый осью автомобиля с фиксированным направлением , например направление м x 1 . Предполагается , что движение происходит во всей плоскости x 1 , x 2 . Если автомобиль фигур ирует в дифференциальной игре , то нужно зн ать о нем больше . Предположим , сто автомоб иль упр авляется с помощью мотора и руля . Мотор управляет тангенциальным ускорением . Эта величина , находящаяся под контролем игрока , является управлением и будет обознача ться через 1 . Чтобы иметь простой и единообразный вид границ ур авнений , м ы примем ускорение равным A 1 . Здесь A – максимальное возможное ускорение , и управление 1 подчиняется теперь огранич ению вида 0 1 1. Таким образом , оно является долей полного ускорения и находится под контролем водителя . Скорость x 4 не находи тся под непосредственным контролем водителя , но ее величину , как и величины x 1 , x 2 , x 3 , о ба игрока должны при нимать в расчет . Следовательно , она должна рассматриваться как фазовая координата . Положение рул я определяет кривизну траектории автомобиля . Но нереально считать , сто водитель может м енять ее произвольно . Имеет смысл принять кривизну траектории автомобиля за еще о дну фазовую координату x 5 (очевидно , физически это есть угол поворота передних колес ), а долю скорости ее изменения - за управлен ие 2 . Итак , если W – максимальная скорость изменения величины x 5 , то скорость , выби раемая водителем , равна W 2 , где -1 2 1. В этих предположениях движение автомобиля будет определяться следующими уравнениями дв ижен ия. x` 1 = x 4 cos x 3 (1) x` 2 = x 4 sin x 3 , (2) x ` 3 = x 4 x 5 , (3) x ` 4 = A 1, 0 1 1 (4) x 5 = W 2 , -1 2 1 (5). Здесь (1), (2) есть просто разложение скорости автомобиля по осям координат ; (3) устанавливает , что скорость изменения направления равна скорости , умноженн ой на кривизну . Что касается (4), то скорость изменения скорости е сть ускорение. Резюмируя , можем сказать , что величины x 1 … x 5 описывают те свойства автомобиля , которые существенны при его участии , скажем , в игре преследования . Они называются фаз овыми коорд инатами . Водитель управляет с помощью величин 1 (положение педали газа ) и 1 (доля скорости вращения руля ). Эт и величины являются управлениями , и только они одни в каждый момент времени наход ятся под контролем игрока . Они , в отл ичие от фазовых координат , не могут быть изменены измерены противником. Данная модель имеет недостаток - неогранич енная скорость . Это можно исправить , налагая ограничения на x 4 , но более естественно и зменить само управлен ие (4). Во-первых , утверж дение , что сила , развиваемая мотором , пропорцио нальна величине , на которую отжата педаль газа , следует считать сверхупрощением динамики автомобиля . Во-вторых , самое важное , эта сила пропорциональна ускорению автомобиля , только ес л и пренебрегать трением . Если п редположить , что трение пропорционально скорости и направлено в противоположном направлении , то получим улучшенный вариант уравнения (4): x ` 4 = F ( A 1 ) – Kx 4 . Здесь A 1 (0 1 1) – величина , на котору ю отжата педаль газа , F – результирующая сила (на е диницу массы автомобиля ), развиваемая мотором , а K – коэф фициент трения . Тогд а скорость будет о граничена величиной F ( A )/ K . Другая существенная поправка состоит в ограничении кривизны x 5 . Итак , уравнения движения можно усложнить для получения более точного соответствия с действительностью или упростить для обле гчения математическ их выкладок . Игры преследован ия. Много примеров игр преследования можно привести из области военного дела : торпеда и корабль , корабль и подлодка , т анк и джип и т.д. Чтобы получить общую картину , будем обозначать преследователя через Р , а преследуемого че рез Е . Соответствующие движущиеся объекты могут управляться человеком или автоматически . В более сложных случаях участников игры может быть больше двух , например группа боевых самолетов противостоит эскадре вражеских бомбардировщиков или – уже из другой о бласти – в футболе несколько нападающих играют с удер живающим мяч противником . В общем случае Р и Е - разумные противники с противоположн ыми интересами . Но если каждый из них управляет лишь одним движущимся объектом , то символами Р и Е будут обозначатьс я сами эти объекты . Так , Р мо жет быть некоторой фиксированной точкой пресл едующего объекта , например его геометрическим центром . Игра преследования обычно считается оконченной , когда произошел захват . Это означа ет , что расстояние РЕ стало меньше некотор ой н аперед заданной величины l . Для пояснения идей остановимся на не которых типичных моментах . За Е обычно при нимают вторгающийся бомбардировщик , самолет или управляемый снаряд , а за Р – защищающи й перехватчик , также самолет или снаряд . В о-вторых , спрашиваетс я : как наилучшим образ ом должен преследовать Е ? Далее , если в каждый момент времени Р знает и свое положение и положение Е , то как он должен в этот момент изменять свои управл ения ? Под положением понимаются не только координаты точек Р или Е , но и другие характеризующие состояние величины , т акие , как направление полета , ориентация , скоро сть , короче – фазовые координаты. Во-вторых , нужно определить , что означает “наилучшим образом” . По терминологии теории игр необходимо выбрать плату . Критерий наиб олее очев иден , если захват всегда осущ ествим . В том случае , когда интерес предст авляют только два исхода игры , будем говор ить о проблеме как о некоторой игре к ачества (в отличии от игры степени , которы е имеют континуум возможных исходов ). Но Р может быть перехват ч иком с о граниченным запасом горючего . Тогда наиболее реальный критерий должен основываться на том , сможет ли произойти захват раньше некото рого определенного момента времени . Если Е – бомбардировщик , цель которого - достижение данного объекта , то наиболе е инте ресным является вопрос , сможет ли быть осу ществлен захват прежде , чем Е выполнит сво е назначение . Если Р использует снаряды , р акеты или другое подобное оружие , то захв ат состоит в том , чтобы оказаться в зо не достижимости Е . Если же Р не уверен , что п опадет в цель точно , о н может ставить своей задачей оказаться в зоне достижимости Е в течение определенн ого времени. Все вышеописанные случаи соответствуют дискретной , точнее , двузначной плате , и мы будем классифицировать соответствующие им игры как игры качества . Но бывают случаи , когда противники стремятся минимизировать или максимизировать определенную переменную величин у . Эта величина есть плата , и игра явля ется игрой степени. Часто в качестве платы удается выбра ть такую непрерывную величину , что она автоматически содержит в себе определенны й выше дискретный критерий . Например , предполо жим , что нас интересует только один вопрос : может ли быть осуществлен захват ? В к ачестве платы можно взять время захвата , п ричем цель Р – сделать это время по возможнос т и меньшим , а цель Е – по возможности большим . Бесконечное вр емя соответствует случаю , когда захват неосущ ествим . Тогда , если Р действует в соответс твии с этим предписанием , он , конечно , дост игает своей основной цели всякий раз , когд а захват осуществим . П р итом сделае т это в кратчайшее время . Теперь предполож им , что вначале целью Р был захват за время , не превосходящее некоторого фиксирова нного Т . минимизируя время захвата Р , разу меется , добьется успеха , если у него есть для этого возможность ; нужно только в зять минимальную величину времени за захвата , которой смог добиться Р , и посмотреть , превосходит эта величина Т или нет. Эта мысль является достаточно общей . Если , скажем , первоначально было желательно уз нать , сможет или нет Е достичь определенно й приближ енности к некоторому объекту , в качестве платы можно выбрать расстояние до объекта в момент захвата . Имеется в виду , что Р стремиться максимизировать э то расстояние , можно быть уверенным , что о н не только выполнит свою задачу , защиты объекта , если это во з можно , но и достигнет наибольшего резерва безопасности или же сделает все , что в его сил ах , если он окажется не в состоянии ра сстроить планы Е. Итак , ответом на вопрос , что означает в играх “наилучшим образом” , является уст ановление численного значения пл аты . Для игр качества это можно сделать несколько искусственно , приписав два (или более ) чис ловых значения величине платы для двух (ил и более ) исходов . “Наилучшим образом” для Р означает сделать эту плату наиболее мал ой. Предположим , что плата выбрана ; ка к Р должен минимизировать ее ? Если он преследует снаряд Е , как ему действо вать ? Должен ли он , например , используя дан ные о положении Е , пытаться экстраполировать будущее движение Е и маневрировать так , чтобы преградить ему путь ? Краткое размышление показ ывает , что такие вопросы бессмысленны . Ответ зависит от того , как будет вести себя Е . Есл и он принял решение двигаться по прямой с постоянной скоростью , то Р , разумеется , сможет преградить ему путь , причем довольно просто подсчитать , как это сделать наилу ч шим образом . Но если Р всегда будет действовать так , то Е , если он достаточно проницателен , может заманить Р в ловушку . Таким образом , никакой план п реследования не будет для Р оптимальным , е сли противник движется произвольно. Из этого следует , сто нельзя го ворить об оптимальном преследовании , не опред елив , что такое оптимальное уклонение . Необход имо одновременно рассматривать всевозможные спос обы поведения обоих противников , для того чтобы разработать методы анализа игровых ситу аций . Оптимальное уклонен ие можно классиф ицировать так же как оптимальное преследовани е . Все замечания , сделанные выше относительно Р и его цели преследования , сохраняют свой смысл и для Е с его целью уклонения . Например , можно говорить о способах избежать захвата или по крайней мере предупредить его до истечении вр емени Т . Если за плату принять расстояние до объекта в момент захвата , то можно обсуждать вопрос о том , как Е должен максимизировать это расстояние . В военных задачах , разумеется , обе стороны рассматривают оба класса э т их вопросов . Выш е обсуждались задачи игры и понятия платы только с точки зрения преследователя Р , но это делалось лишь для того , чтобы облегчить описание. На рисунке 1 С есть область расположе ния объекта , который Р защищает от атакующ его врага Е ; Р и Е об а соверша ют простое движение с одинаковой скоростью и начинают двигаться из положения , указанно го на рис .1. Примем здесь для простоты , что захват означает совпадение точек Р и Е . Платой является расстояние от точки захвата до С (если захват возможен ); Р должен максимизировать это расстояни е , а Е – минимизировать его . Если Е может достичь С и захвата не произойде т , то этот исход считается для Е наилу чшим. Вообразим , что Е – носитель могущес твенного оружия , скажем , ядерного , и если о н не может достичь объе кта , то стр емиться взорваться как можно ближе к нему . Соответственно перехватчик Р стремиться вст ретить его в наиболее удаленной от С точке. . Е С . Р Рисунок 1. А вот пример посложнее . Он представляе т собой игру преследования , где один из пр отивников вынужден двигаться так , что бы кривизна его траектории не превышала н екоторой величины . Это кинематическое ограничение типично . Дано : автомобиль на бесконечной пустой площади , который пытается наехать на пешехо да . Таким образом , рассматривается игра п реследования , где Р обладает превосходящей ск оростью , но меньшей маневренностью по сравнен ию с Е . Преследователь Р движется с по стоянной скоростью w 1 , радиус кривизны е го траектории ограничен заданной величиной R ; P управляет выбором значения этой к ривизны в к аждый момент . Убегающий Е обладает более п ростым движением . Это значит , что его скор ость w 2 фиксирована , и управление состои т в том , что в каждый момент выбираетс я направление движения . В этом случае допу стимы любые крутые повороты ; траектория м ожет не иметь касательной в каждой точке. Захват происходит , когда расстояние РЕ не больше заданной величины l , радиуса захват а . Преследователь обязан быть быстрее w 1 > w 2 . Нас интересуют два вопроса. 1. Игра качества . Когда Р может поймать Е ? Ясно , что е сли R велико , l мало и w 1 не очень превышает w 2 , то Е всегда может избежать захвата . Можно считать , например , что он сделает это , просто отступая в сторону всякий р аз , когда появляется угроза захвата . Ограничен ие кривизны траектории преследователя запреща ет ему слишком резкие повороты . Он может промчаться мимо Е и , вернувшись о братно для новой попытки , может быть снова обманут тем же маневром Е. Задача состо ит в том , чтобы определить точные условия : значения R , l , w 1 / w 2 , которые разграничивают эти в озможност и . 2. Игра степени с временем захвата в качестве платы . Теперь предположим , что Р всегда может поймать , и выберем пла той время , в течении которого происходит з ахват . В терминах принятой терминологии можно считать , что пешеход надеется на прибытие спасения и потому , если он сам не может избежать захвата , то по крайней мере старается отсрочить его . Разумеется , Р стремиться действовать настолько быстро , на сколько позволяют обстоятельства. Если вначале Е находится более или менее впереди Р , оптимальный ход иг ры очевиден . На рис .2(а ) точка Р изображает начальное положение преследователя , его скорость направлена вверх ; убегающий нахо дится в точке Е , впереди Р и , скажем , немного правее его . На рисунке изображена часть окружности максимальной кривизны , допу стимо й для траектории преследователя ; вектор скорости касается ее в точке Р . согласно предписанию своей оптимальной стра тегии , Р должен начать движение по этой дуге , делая максимально крутой поворот впра во – до точки Р 1, где его скорость направлена на Е . Далее о н движ ется по касательной , как показано . Соответстве нно Е движется по той же касательной , и это простое преследование продолжается вдол ь прямой вплоть до совершения захвата , ска жем , в точке С. Пусть теперь Р начинает прес ледование из положения , когда Е на ходи тся у него в тылу , как показано на рис .2 (б ). Если Р будет действовать , как описано выше , может случиться , что Е усп еет попасть внутрь окружности максимальной кр ивизны раньше , чем Р успеет его задавить . Для осуществления захвата Р должен д ействовать менее прямолинейно , например , как показано на рис .2(в ). Вначале он движет ся прочь от Е и , отступив достаточно д алеко , возвращается по дуге окружности , чтобы начать прямое преследование . Со своей сто роны Е , учитывая , что время является плато й , стремится о т срочить захват . С этой целью он начинает свое отступление , сперва следуя за Р , скажем вдоль ЕЕ 1. В некоторой точке Е 1 он поворачивается и убегает в направлении , выбранном так же , как в случае (а ). Такой тип преследования будет называтьс я маневром разворот а . Он составляет на иболее интересный случай с точки зрения м атематики игры степени. Рис . 2(а ) . С Е Р 1 R Р а Рис .2 (б ) Р l Е Рис . 2(в ) R E1 E R P . C
1Архитектура и строительство
2Астрономия, авиация, космонавтика
 
3Безопасность жизнедеятельности
4Биология
 
5Военная кафедра, гражданская оборона
 
6География, экономическая география
7Геология и геодезия
8Государственное регулирование и налоги
 
9Естествознание
 
10Журналистика
 
11Законодательство и право
12Адвокатура
13Административное право
14Арбитражное процессуальное право
15Банковское право
16Государство и право
17Гражданское право и процесс
18Жилищное право
19Законодательство зарубежных стран
20Земельное право
21Конституционное право
22Конституционное право зарубежных стран
23Международное право
24Муниципальное право
25Налоговое право
26Римское право
27Семейное право
28Таможенное право
29Трудовое право
30Уголовное право и процесс
31Финансовое право
32Хозяйственное право
33Экологическое право
34Юриспруденция
 
35Иностранные языки
36Информатика, информационные технологии
37Базы данных
38Компьютерные сети
39Программирование
40Искусство и культура
41Краеведение
42Культурология
43Музыка
44История
45Биографии
46Историческая личность
47Литература
 
48Маркетинг и реклама
49Математика
50Медицина и здоровье
51Менеджмент
52Антикризисное управление
53Делопроизводство и документооборот
54Логистика
 
55Педагогика
56Политология
57Правоохранительные органы
58Криминалистика и криминология
59Прочее
60Психология
61Юридическая психология
 
62Радиоэлектроника
63Религия
 
64Сельское хозяйство и землепользование
65Социология
66Страхование
 
67Технологии
68Материаловедение
69Машиностроение
70Металлургия
71Транспорт
72Туризм
 
73Физика
74Физкультура и спорт
75Философия
 
76Химия
 
77Экология, охрана природы
78Экономика и финансы
79Анализ хозяйственной деятельности
80Банковское дело и кредитование
81Биржевое дело
82Бухгалтерский учет и аудит
83История экономических учений
84Международные отношения
85Предпринимательство, бизнес, микроэкономика
86Финансы
87Ценные бумаги и фондовый рынок
88Экономика предприятия
89Экономико-математическое моделирование
90Экономическая теория

 Анекдоты - это почти как рефераты, только короткие и смешные Следующий
В детстве спать было наказание, а теперь - мечта.
Anekdot.ru

Узнайте стоимость курсовой, диплома, реферата на заказ.

Обратите внимание, курсовая по математике "Военные игры. Игры преследования", также как и все другие рефераты, курсовые, дипломные и другие работы вы можете скачать бесплатно.

Смотрите также:


Банк рефератов - РефератБанк.ру
© РефератБанк, 2002 - 2016
Рейтинг@Mail.ru