Задача удержания в дифференциальных играх

Рассмотрены дифференциальные игры убегания, в которых цель догоняющего игрока удержать траекторию управляемого дифференциального уравнения в заданном замкнутом подмножестве евклидового пространства. Изучены случаи простого движения, движения с простой матрицей. В общем линейном случае применен метод...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2003
Hauptverfasser: Амиргалиева, С.Н., Остапенко, В.В., Терещенко, И.Н.
Format: Artikel
Sprache:Russian
Veröffentlicht: Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2003
Schriftenreihe:Системні дослідження та інформаційні технології
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/50314
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Задача удержания в дифференциальных играх / С.Н. Амиргалиева, В.В. Остапенко, И.Н. Терещенко // Систем. дослідж. та інформ. технології. — 2003. — № 3. — С. 75-80. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-50314
record_format dspace
spelling irk-123456789-503142013-10-11T03:05:30Z Задача удержания в дифференциальных играх Амиргалиева, С.Н. Остапенко, В.В. Терещенко, И.Н. Методи оптимізації, оптимальне управління і теорія ігор Рассмотрены дифференциальные игры убегания, в которых цель догоняющего игрока удержать траекторию управляемого дифференциального уравнения в заданном замкнутом подмножестве евклидового пространства. Изучены случаи простого движения, движения с простой матрицей. В общем линейном случае применен метод выпуклых множеств. Розглянуто диференціальні ігри утікання, в яких мета гравця, що наздоганяє, утримати траєкторію керованого диференціального рівняння в заданій замкненій підмножині євклідового простору. Мета того, що утікає, протилежна. Вивчено випадки простого руху, а також руху з простою матрицею. У загальному лінійному випадку застосовано метод -опуклих множин. Differential games of retention are considered, in which the purpose of a catching player is to keep the trajectory of the controlled differential equation in the given closed subset of the euclidian space. The purpose of an escaping player is opposite. Cases of simple movement and movement with a simple matrix have been investigated. In the general linear case, the -convex sets method is applied. 2003 Article Задача удержания в дифференциальных играх / С.Н. Амиргалиева, В.В. Остапенко, И.Н. Терещенко // Систем. дослідж. та інформ. технології. — 2003. — № 3. — С. 75-80. — Бібліогр.: 5 назв. — рос. 1681–6048 http://dspace.nbuv.gov.ua/handle/123456789/50314 518.9 ru Системні дослідження та інформаційні технології Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Методи оптимізації, оптимальне управління і теорія ігор
Методи оптимізації, оптимальне управління і теорія ігор
spellingShingle Методи оптимізації, оптимальне управління і теорія ігор
Методи оптимізації, оптимальне управління і теорія ігор
Амиргалиева, С.Н.
Остапенко, В.В.
Терещенко, И.Н.
Задача удержания в дифференциальных играх
Системні дослідження та інформаційні технології
description Рассмотрены дифференциальные игры убегания, в которых цель догоняющего игрока удержать траекторию управляемого дифференциального уравнения в заданном замкнутом подмножестве евклидового пространства. Изучены случаи простого движения, движения с простой матрицей. В общем линейном случае применен метод выпуклых множеств.
format Article
author Амиргалиева, С.Н.
Остапенко, В.В.
Терещенко, И.Н.
author_facet Амиргалиева, С.Н.
Остапенко, В.В.
Терещенко, И.Н.
author_sort Амиргалиева, С.Н.
title Задача удержания в дифференциальных играх
title_short Задача удержания в дифференциальных играх
title_full Задача удержания в дифференциальных играх
title_fullStr Задача удержания в дифференциальных играх
title_full_unstemmed Задача удержания в дифференциальных играх
title_sort задача удержания в дифференциальных играх
publisher Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
publishDate 2003
topic_facet Методи оптимізації, оптимальне управління і теорія ігор
url http://dspace.nbuv.gov.ua/handle/123456789/50314
citation_txt Задача удержания в дифференциальных играх / С.Н. Амиргалиева, В.В. Остапенко, И.Н. Терещенко // Систем. дослідж. та інформ. технології. — 2003. — № 3. — С. 75-80. — Бібліогр.: 5 назв. — рос.
series Системні дослідження та інформаційні технології
work_keys_str_mv AT amirgalievasn zadačauderžaniâvdifferencialʹnyhigrah
AT ostapenkovv zadačauderžaniâvdifferencialʹnyhigrah
AT tereŝenkoin zadačauderžaniâvdifferencialʹnyhigrah
first_indexed 2025-07-04T11:54:42Z
last_indexed 2025-07-04T11:54:42Z
_version_ 1836717266205409280
fulltext © С.Н. Амиргалиева, В.В. Остапенко, И.Н. Терещенко, 2003 Системні дослідження та інформаційні технології, 2003, № 3 75 УДК 518.9 ЗАДАЧА УДЕРЖАНИЯ В ДИФФЕРЕНЦИАЛЬНЫХ ИГРАХ С. Н. АМИРГАЛИЕВА, В. В. ОСТАПЕНКО, И. Н. ТЕРЕЩЕНКО Рассмотрены дифференциальные игры убегания, в которых цель догоняющего игрока удержать траекторию управляемого дифференциального уравнения в заданном замкнутом подмножестве евклидового пространства. Изучены слу- чаи простого движения, движения с простой матрицей. В общем линейном случае применен метод −H выпуклых множеств. ВВЕДЕНИЕ Современная теория дифференциальных игр рассматривает либо отдельно задачу преследования и задачу убегания (при этом используются совер- шенно разные методы решения), либо объединенную задачу сближения- уклонения [1–5]. Задача сближения-уклонения может изучаться на фиксированном интер- вале времени ],0[ θ . При этом существует две постановки: 1 — время окон- чания игры фиксировано и равно θ ; 2 — игра может закончиться раньше θ . Игру ведут два игрока: P (догоняющий) и E (убегающий). Цель игро- ка P — попасть (в конце игры) на терминальное множество M . При этом он должен удержать траекторию во множестве фазовых ограничений N . Естественно предположить, что NM ⊂ . Рассмотрим игру с фиксированным временем окончания при условии NM = . В этом случае цель игрока P — удержать траекторию динамиче- ской системы во множестве M на всем интервале ],0[ θ . Такая задача удер- жания является частным случаем задачи сближения-уклонения с фиксиро- ванным временем окончания. В данной статье рассматривается более сложный случай, когда цель иг- рока P — удержать траекторию во множестве M на всей полуоси ],0[ ∞+ . Исследование дифференциальной игры удержания актуально, посколь- ку моделирует процесс удержания в заданных пределах параметров функ- ционирующего во времени объекта при наличии неопределенных помех. 1. ПОСТАНОВКА ЗАДАЧИ Рассмотрим дифференциальную игру, описываемую динамикой ),,( vuzfz = , где nEz∈ ; Uu∈ ; Vv∈ ; nE — n -мерное евклидово пространство; U и V — компакты в евклидовых пространствах. Функция f удовлетворяет условиям [1], которые обеспечивают суще- ствование, продолжаемость, единственность траектории и компактность пучка траекторий: С. Н. Амиргалиева, В. В. Остапенко, И. Н. Терещенко ISSN 1681–6048 System Research & Information Technologies, 2003, № 3 76 1) ),,( vuzf — непрерывна по совокупности переменных и локально Липшицева по z ; 2) существует константа C такая, что zCvuzf ≤),,( для всех nEz∈ , Uu∈ , Vv∈ ; 3) множество ),,( vuzf выпукло для всех nEz∈ , Vv∈ . Допустимыми управлениями игроков P и E являются измеримые функции со значениями соответственно U и V . Игра ведется в ε -стратегиях или в вольтерровских отображениях [1]. При ε -стратегиях игрок E выбирает в начальный момент 0t разбиение { }θω =≤≤≤≤== ktttt …210 0 отрезка ],0[ θ . В каждый момент it игрок E , зная )( itz , выбирает допусти- мое управление )(tvi , ),[ 1+∈ ii ttt . Игрок P в каждый момент времени it , зная )( itz и управление )(tvi , ),[ 1+∈ ii ttt , выбирает свое управление )(tui , ),[ 1+∈ ii ttt . Когда игрок P строит свое управление с помощью вольтерровских отображений, то он для выбора )(tu использует информацию о )0(0 zz = и обо всей предыстории )(sv , ts ≤≤0 . Пусть nEM ⊂ — замкнутое множество, которое будем называть тер- минальным. Цель игрока P добиться включения Mtz ∈)( , ),0[ +∞∈t , ис- пользуя те или иные стратегии. Цель игрока E — противоположная. 2. ОБЩЕЕ РЕШЕНИЕ Задача сближения-уклонения с фиксированным временем окончания описы- вается следующими операторами: MPN ε, , MPN ω , MPN θ, ~ , которые ставят в соответствие множеству M некоторое множество начальных позиций. Множество MPN ε, является множеством начальных позиций Nz ∈0 таких, что для любого допустимого )(tv , ],0[ ε∈t существует допустимое )(tu , ],0[ ε∈t такое, что для соответствующей траектории )(tz с началом в 0z выполняется включение Mz ∈)(ε . Пусть ω — некоторое разбиение ин- тервала ],0[ θ . Обозначим 1−−= iii ttε , ki …1= . Положим MPPPMP kN εεε ω … 21 = , ∩ ω ω θ MPMP NN =, ~ , где пересечение берется по всем разбиениям ω . В работе [1] показано, что если MPz N θ,0 ~ ∈ , то игрок P , пользуясь ε - стратегиями (или вольтерровскими отображениями), может добиться того, что для соответствующей траектории )(tz выполняются включения Задача удержания в дифференциальных играх Системні дослідження та інформаційні технології, 2003, № 3 77 Mz ∈)(θ , Ntz ∈)( для всех ],0[ θ∈t . Если MPz N θ,0 ~ ∉ , то либо Mz ∉)(θ , либо Ntz ∉)( для некоторого ],0[ θ∈t . Положим MN = . Множество MPM θ, ~ описывает множество всех на- чальных позиций, из которых игрок P может удержать траекторию )(tz во множестве M на всем интервале ],0[ θ . Выше определялись ε -стратегии на конечном отрезке ],0[ θ . Их не- трудно обобщить на полуось ),0[ +∞ , считая, что { ≤≤≤== 210 0 tttω }…… 1+≤≤≤ kk tt является разбиением полуоси ),0[ +∞ , которое не имеет точек сгущения. Положим ∩ 0 , ~~ ≥ = t tM MPMP . Множество MP~ — множество всех на- чальных позиций, из которых игрок P может удержать траекторию )(tz во множестве M на всей полуоси ),0[ +∞ . Если ∅=MP~ , то представляет интерес задача нахождения максималь- ного ),0[ ∞∈∗t такого, что 0~ , ≠MP tM для всех ],0[ ∗∈ tt . 3. ЛИНЕЙНЫЕ ИГРЫ С ПРОСТОЙ МАТРИЦЕЙ В данном случае динамика игры описывается уравнением vuzaz +−= , где a — число. Рассмотрим случай, когда M — выпуклое компактное множество, M∈0 , MU α= , MV β= , αβ ≥ , r=−αβ , 0<a . В этом случае получаем [1] ∩ ∪ Mv Mu t taat tM MvudezeMzMP β α τ τ ∈ ∈ − ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ∈+−+∈= ∫ 0 )( 00, )(:~ . Отсюда ∩MMdeMdeMeMP t a t aat tM ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ += ∫∫ −−− 0 * 0 , ~ τβτα ττ . Для t , для которых функция 0)1(1)( ≥−−= −− re a etf atat , множество MP tM , ~ имеет вид ∩MMre a eMP atat tM ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ⎥⎦ ⎤ ⎢⎣ ⎡ −−= −− )1(1~ , . Напомним, что ∩ 0 , ~~ ≥ = t tM MPMP . Так как M∈0 , то множества MP tM , ~ , 0≥t вложены друг в друга. Поэтому для получения MP~ надо найти мини- мум функции )(tf . Возьмем производную ateratf −−−=′ )()( . С. Н. Амиргалиева, В. В. Остапенко, И. Н. Терещенко ISSN 1681–6048 System Research & Information Technologies, 2003, № 3 78 Если ra ≥− , то функция )(tf не убывает. Поэтому ее минимум нахо- дится в точке 0=t . Поскольку 1)0( =f , то получаем MMP = ~ . Если ra <− , то функция )(tf убывает. Поскольку 0>− a , а функцию )(tf можно записать в виде ⎥⎦ ⎤ ⎢⎣ ⎡ − −+−= − a rer a tf at 11)( , то, учитывая, что ra <− , получаем −∞= ∞→ )(lim tf t . Поэтому в таком случае можно рассмотреть задачу нахождения макси- мального t , при котором 0~ , ≠MP tM , для чего достаточно найти корень уравнения 0)( =tf . Очевидно, он равен 1 1 2 ln1 − ∗ ⎥⎦ ⎤ ⎢⎣ ⎡ + − = a a t . Теперь остановимся на случае βα ≥ , βα −=r , 0>a . Здесь ∩MMre a eMP atat tM ⎭ ⎬ ⎫ ⎩ ⎨ ⎧ ⎥⎦ ⎤ ⎢⎣ ⎡ −+= −− )1(1~ , . Для решения поставленных задач нужно найти минимум функции )1(1)( atat e a etg −− −+= . Возьмем производную ateratg −+−=′ )()( . Если ra > , то функция )(tg убывает. При этом a rtg t += ∞→ 1)(lim . Но поскольку MMP ⊂ ~ , то получаем MMP = ~ . Если ra ≤ , то функция не убывает. Поэтому минимум достигается при 0=t . При этом 1)0( =g и, следовательно, MMP = ~ . 4. МЕТОД H - ВЫПУКЛЫХ МНОЖЕСТВ ДЛЯ РЕШЕНИЯ ЛИНЕЙНЫХ ИГР Напомним определение понятия H -выпуклых множеств [1]. Определение 1. Пусть { }1: =∈⊂ xExH n . Множество M называется H -выпуклым, если оно представимо в виде ( ){ }∩ Hx n xcxxExM ∈ ∗∗ ∗ ≤∈= ,: , Задача удержания в дифференциальных играх Системні дослідження та інформаційні технології, 2003, № 3 79 где )( ∗xc может принимать значение ∞+ . В качестве числа )( ∗xc можно взять значение опорной функции множества M , т. е. ∗ ∈ ∗∗ == xxxWxc Mx M ,sup)()( . Рассмотрим игру с динамикой vuAzz +−= , где nn EEA →: — линейный оператор; Uu∈ ; Vv∈ , где U и V — ком- пакты. В качестве H выберем множество собственных вещественных векто- ров оператора ∗A . Считаем, что множества M , U и V — H -выпуклы. Тогда ( ){ }∩ Hx M n xWxxExM ∈ ∗∗ ∗ ≤∈= ,: , ( ){ }∩ Hx U n xWxxExU ∈ ∗∗ ∗ ≤∈= ,: , ( ){ }∩ Hx V n xWxxExV ∈ ∗∗ ∗ ≤∈= ,: , из [1] ∩ ∪ Vv Uu t tAAt tM MvudezeMzMP ∈ ∈ − = ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ∈+−+∈= ∫ 0 )( 00, )(:~ ττ ∩MVdeUdeMe t A t AAt ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ += ∫∫ −−− 0 * 0 ττ ττ . Предположим, что имеет место полное выметание множества ∫ − t A Vde 0 ττ из множества ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + ∫ −− t AAt UdeMe 0 ττ , т. е., если обозначить через D множество ∫∫ −−− − ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ += t A t AAt VdeUdeMeD 0 * 0 ττ ττ , то DVdeUdeMe t A t AAt += ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎣ ⎡ + ∫∫ −−− 00 ττ ττ . В этом случае MPx tM , ~ ∈ тогда и только тогда, когда для любого Hx ∈∗ = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ − ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ +⎟ ⎠ ⎞⎜ ⎝ ⎛≤ ∫∫ ∗−∗−∗−∗ ∗∗∗ t A V t A U tA M xdeWxdeWxeWxx 00 , ττ ττ С. Н. Амиргалиева, В. В. Остапенко, И. Н. Терещенко ISSN 1681–6048 System Research & Information Technologies, 2003, № 3 80 ∫∫ ∗−∗−∗− ∗∗∗ −+= t V x t U x M tx xWdexWdexWe 0 )( 0 )()( )()()( ττ τλτλλ , где )( ∗xλ — собственное число оператора ∗A , соответствующее собственному вектору ∗x , и правая часть в данной формуле неотрицательна для всех Hx ∈∗ . Так же, как и в п. 3, рассмотрим различные случаи. Обозначим через −H множество всех собственных единичных векторов ∗A , для которых соответст- вующие собственные числа меньше нуля; +H — множество всех собственных векторов ∗A , для которых соответствующие собственные числа не меньше нуля. Если для всех − ∗ ∈Hx выполняется )()( ∗∗ ≥ xWxW UV и ≥− ∗∗ )()( xWx Mλ )()( ∗∗ −≥ xWxW UV , то MMP = ~ . Если )()()()( ∗∗∗∗ −<− xWxWxWx UVMλ для некоторых ∗x , то 0~ =MP , и максимальное ∗t , при котором 0~ , ≠tMP , ищется как минимальное реше- ние уравнения [ ] 0)()( 0 )()( =−+ ∫ ∗∗−− ∗∗ t VU x M tx xWxWdeWe ττλλ , где минимум берется по указанным ∗x . ВЫВОДЫ Поставлена новая задача удержания в дифференциальных играх. Рассмотрен общий случай, когда игроки играют в ε -стратегиях, и структура игры описывается операторными конструкциями Б. Н. Пшеничного. Изучен линейный случай с простой и произвольной матрицами. В по- следнем случае используется метод H -выпуклых множеств. В перспективе разработка достаточно конструктивных приближенных методов решения задач удержания в нелинейных дифференциальных играх. ЛИТЕРАТУРА 1. Пшеничный Б.Н., Остапенко В. В. Дифференциальные игры. — Киев: Наук. думка, 1991. — 264 с. 2. Понтрягин Л.С. Линейные дифференциальные игры преследования // Мат. сб. — 1980. — 112, № 3. — С. 307–330. 3. Понтрягин Л.С. Линейные дифференциальные игры убегания // Тр. МИ АН СССР. — 1971. — 112. — С. 30–63. 4. Красовский Н.Н., Субботин А. И. Позиционные дифференциальные игры. — М.: Наука, 1977. — 456 с. 5. Чикрий А.А. Конфликтно управляемые процессы. — Киев: Наук. думка, 1992. — 382 с. Поступила 02.06.2003