Линейные дифференциальные игры с разнотипными интегральными ограничениями
Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управлен...
Збережено в:
Дата: | 2002 |
---|---|
Автори: | , |
Формат: | Стаття |
Мова: | Russian |
Опубліковано: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2002
|
Назва видання: | Системні дослідження та інформаційні технології |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/50218 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Линейные дифференциальные игры с разнотипными интегральными ограничениями / В.В. Остапенко, И.Л. Рыжкова // Систем. дослідж. та інформ. технології. — 2002. — № 1. — С. 141-153. — Бібліогр.: 12 назв. — рос. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-50218 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-502182013-10-07T03:06:33Z Линейные дифференциальные игры с разнотипными интегральными ограничениями Остапенко, В.В. Рыжкова, И.Л. Математичні методи, моделі, проблеми і технології дослідження складних систем Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управление, зная управление убегающего, а убегающий в каждый момент времени использует информацию о действиях противника в прошлом. Розглянуто лінійні диференціальні ігри з інтегральними обмеженнями на керування гравців з фіксованим часом закінчення. Умови повного вимітання, що були сформульовані для випадку геометричних обмежень, перенесено на випадок інтегральних обмежень. Доганяючий гравець будує своє керування, знаючи керування втікача, а утікач, в кожний момент часу використовує інформацію про дії супротивника в минулому. The linear differential game with integral restriction on players’ controls with fixed finishing time are considered in this paper. Соnditions of full sweepness that were formulated for the geometric restrictions case are transformed to integral restrictions case. Pursuer builds its control knowing escaper’s control, but escaper uses information about action of opponent in past in each moment of time. 2002 Article Линейные дифференциальные игры с разнотипными интегральными ограничениями / В.В. Остапенко, И.Л. Рыжкова // Систем. дослідж. та інформ. технології. — 2002. — № 1. — С. 141-153. — Бібліогр.: 12 назв. — рос. 1681–6048 http://dspace.nbuv.gov.ua/handle/123456789/50218 518.9 ru Системні дослідження та інформаційні технології Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Математичні методи, моделі, проблеми і технології дослідження складних систем Математичні методи, моделі, проблеми і технології дослідження складних систем |
spellingShingle |
Математичні методи, моделі, проблеми і технології дослідження складних систем Математичні методи, моделі, проблеми і технології дослідження складних систем Остапенко, В.В. Рыжкова, И.Л. Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології |
description |
Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управление, зная управление убегающего, а убегающий в каждый момент времени использует информацию о действиях противника в прошлом. |
format |
Article |
author |
Остапенко, В.В. Рыжкова, И.Л. |
author_facet |
Остапенко, В.В. Рыжкова, И.Л. |
author_sort |
Остапенко, В.В. |
title |
Линейные дифференциальные игры с разнотипными интегральными ограничениями |
title_short |
Линейные дифференциальные игры с разнотипными интегральными ограничениями |
title_full |
Линейные дифференциальные игры с разнотипными интегральными ограничениями |
title_fullStr |
Линейные дифференциальные игры с разнотипными интегральными ограничениями |
title_full_unstemmed |
Линейные дифференциальные игры с разнотипными интегральными ограничениями |
title_sort |
линейные дифференциальные игры с разнотипными интегральными ограничениями |
publisher |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
publishDate |
2002 |
topic_facet |
Математичні методи, моделі, проблеми і технології дослідження складних систем |
url |
http://dspace.nbuv.gov.ua/handle/123456789/50218 |
citation_txt |
Линейные дифференциальные игры с разнотипными интегральными ограничениями / В.В. Остапенко, И.Л. Рыжкова // Систем. дослідж. та інформ. технології. — 2002. — № 1. — С. 141-153. — Бібліогр.: 12 назв. — рос. |
series |
Системні дослідження та інформаційні технології |
work_keys_str_mv |
AT ostapenkovv linejnyedifferencialʹnyeigrysraznotipnymiintegralʹnymiograničeniâmi AT ryžkovail linejnyedifferencialʹnyeigrysraznotipnymiintegralʹnymiograničeniâmi |
first_indexed |
2025-07-04T11:47:23Z |
last_indexed |
2025-07-04T11:47:23Z |
_version_ |
1836716807196508160 |
fulltext |
© В.В. Остапенко, И.Л. Рыжкова
Системні дослідження та інформаційні технології, 2002, 1 141
УДК 518.9
ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С
РАЗНОТИПНЫМИ ИНТЕГРАЛЬНЫМИ ОГРАНИЧЕНИЯМИ
В.В. ОСТАПЕНКО, И.Л. РЫЖКОВА
Рассмотрены линейные дифференциальные игры с интегральными
ограничениями на управления игроков и с фиксированным временем
окончания. Условия полного выметания, сформулированные для случая
геометрических ограничений, перенесены на случай интегральных
ограничений. Догоняющий игрок строит свое управление, зная управление
убегающего, а убегающий в каждый момент времени использует информацию
о действиях противника в прошлом.
ВВЕДЕНИЕ
Современная теория дифференциальных игр в основном развивается как
теория управляемых динамических систем с геометрическими
ограничениями на управления игроков [1–5]. Были описаны структуры
дифференциальных игр; исследованы различные способы задания стратегий
игроков, при которых игроки не знают управления противника в будущем;
разработаны общие подходы и конкретные методы решения различных
классов дифференциальных игр. Вместе с тем работы ряда авторов [6–9]
показывают, что перенесение методов, разработанных для игр с
геометрическими ограничениями, на игры с интегральными ограничениями
является непростой задачей. Это связано с тем, что класс управляющих
функций, удовлетворяющих интегральному ограничению, не обладает
важными свойствами, которыми обладает класс управлений,
удовлетворяющих геометрическому ограничению. Так, например, подход к
описанию структуры игры, основанный на операторных конструкциях
Б.Н. Пшеничного [4], не переносится непосредственно на игры с
интегральными ограничениями. Поэтому актуальным остается вопрос
обобщения известных методов теории дифференциальных игр на игры с
интегральными ограничениями.
В работах [10, 11] создан метод, позволяющий сводить дифференциальную
игру к обычной задаче управления. При этом важную роль играет условие
полного выметания, которое накладывается на области управления игроков.
В работе [12] это условие заменялось однотипностью интегральных
ограничений для обоих игроков.
Данная статья обобщает результаты, полученные в [12]. В ней
рассматриваются разнотипные интегральные ограничения, связанные между
собой аналогом условия полного выметания.
В.В. Остапенко, И.Л. Рыжкова
ISSN 1681–6048 System Research & Information Technologies, 2002, 1 142
1. ПОСТАНОВКА ЗАДАЧИ
Рассмотрим дифференциальную игру, динамика которой описывается
уравнением
)()( vutCz −= , (1)
где ;,, nEvuz ∈ nE — n-мерное евклидово пространство; )(tC –– семейство
линейных операторов, действующих в nE , непрерывных на отрезке [ ]Θ;0 ;
0>Θ –– фиксированный момент времени.
Игрок Р (догоняющий) распоряжается параметром u , игрок Е
(убегающий) –– параметром v . Цель игрока Р –– добиться включения
Mz ∈Θ)( ; цель игрока Е –– противоположная. Терминальное множество М
является замкнутым подмножеством пространства nE .
Будем предполагать, что игрок Р при выборе в момент времени t
управления )(tu знает начальную позицию 0)0( zz = и текущее управление
)(tv игрока Е. Игрок Е в момент времени t выбирает )(tv , зная 0)0( zz = и
управление игрока Р )(su при ts < .
Опишем интегральные ограничения на управления игроков с помощью
некоторых выпуклых множеств и их функций Минковского. Пусть VU , и
W –– выпуклые компактные подмножества пространства nE , имеющие
непустую внутренность и содержащие ноль в качестве внутренней точки. В
дальнейшем будет использоваться следующее условие.
Условие 1 WVU += .
Условие 1 является условием полного выметания для множеств U и V .
Напомним, что функция Минковского )/( Axµ выпуклого множества
nEA⊂ такого, что Aint0∈ , определяется по формуле:
{ }AxAx λλµ ∈>= :0inf)/( .
Отметим, что для замкнутого выпуклого множества A справедлива
формула { }1)/(: ≤= AxxA µ . Обозначим )/()(),/()( VvvbUuua µµ == ,
)/()( Wwwf µ= .
Отметим, что функции )(),( vbua и )(wf как функции Минковского
некоторых множеств являются выпуклыми, положительно однородными.
Условие 2. Существуют такие числа 0, 21 >λλ , что для всех nEwv ∈,
выполняется неравенство
)()()( 21 wfvbwva λλ +≤+ .
Ниже будет описан способ получения коэффициентов 1λ и 2λ и
рассмотрены примеры, в которых рассчитаны конкретные значения 1λ и
2λ . Согласно изложенному ниже способу, 121 ≥+λλ .
Рассмотрим два интегральных ограничения на управления игрока Р
Линейные дифференциальные игры с разнотипными интегральными ограничениями
Системні дослідження та інформаційні технології, 2002, 1 143
( ) 21
0
)( λλ +≤∫
Θ
dttua , (2)
( ) 1)(
0
∫
Θ
≤dttua . (3)
Интегральное ограничение на управление игрока Е имеет вид
( ) 1)(
0
∫
Θ
≤dttvb . (4)
Управления )(tu и )(tv , удовлетворяющие ограничениям (2) или (3) и
(4), будем называть допустимыми управлениями игроков Р и Е
соответственно.
В статье рассматривается игра с двух разных позиций: с позиции
догоняющего и с позиции убегающего. В первом случае используется
ограничение вида (2), во втором ― вида (3).
Введем множество W~ , которое используется при формулировке
результатов
( )
⎪⎭
⎪
⎬
⎫
⎪⎩
⎪
⎨
⎧
≤= ∫∫
ΘΘ
1)(:)()(~
00
dttwfdttwtCW ∪ ,
т.е. W~ является множеством всех обычных интегралов вида ∫
Θ
0
)()( dttwtC ,
где )(tw — измеримая функция, удовлетворяющая ограничению
( ) 1)(
0
∫
Θ
≤dttwf . (5)
Следует отметить, что функции )(),( tvtu и )(tw , удовлетворяющие
соответственно ограничениям (2) – (5), принадлежат классу ];0[1 ΘL .
Действительно, рассмотрим для примера ограничение (3). Так как функция
)(ua выпукла и +∞<)(ua для всех nEu∈ , то )(ua непрерывна. Поскольку
Uint0∈ , то 0)( >ua для всех 0≠u . Поэтому 0)(min 1
1
>=
=
aua
u
. Отсюда для
любого 1a
u
uaEu n ≥⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
∈ и в силу положительной однородности )(ua
получаем
)(1
1
ua
a
u ≤ .
Из этого неравенства вытекает
( ) +∞<≤≤ ∫∫
ΘΘ
1010
1)(1)(
a
dttua
a
dttu . (6)
В силу условий, наложенных на семейство операторов )(tC ,
управление (1) имеет решение при любых допустимых управлениях игроков
В.В. Остапенко, И.Л. Рыжкова
ISSN 1681–6048 System Research & Information Technologies, 2002, 1 144
и, кроме того, каждый интеграл, входящий в определение множества W~ ,
имеет смысл. Кроме того, нетрудно видеть, что множество W~ является
замкнутым и ограниченным, т.е. компактным.
В дальнейшем всюду будем предполагать выполнение условий 1 и 2.
2. ПОСТРОЕНИЕ УПРАВЛЕНИЯ ДОГОНЯЮЩЕГО ИГРОКА
Рассмотрим игру с динамикой (1) и ограничениями (2), (4). Обозначим
WMMP ~
−=Θ .
Теорема 1. Пусть MPz Θ∈0 . Тогда существует отображение nn EEu →+
∗
1:
такое, что для любого допустимого управления )(tv игрока Е выполняется:
а) ( )−ttvu ),(* допустимое управление игрока Р;
б) для решения )(tz уравнения (1) с начальным условием 0)0( zz = ,
которое соответствует управлениям ( )ttvu ),(* и )(tv , справедливо
включение Mz ∈Θ)( .
Доказательство. Из определения множества W~ следует, что если
MPz Θ∈0 , то существует функция )(tw , удовлетворяющая ограничению (5)
такая, что
MdttwtCz ∈+ ∫
Θ
0
0 )()( .
Положим ( ) )(,* twvtvu += . Пусть −)(tv произвольное допустимое
управление игрока Е. Тогда управление игрока Р имеет вид
( ) )()(),()( * twtvttvutu +== .
Отметим, что значение )(tu строится на основании информации о функциях
)(tv и )(tw . Функция )(tw строится по начальной позиции 0z . Таким
образом, данный способ построения управления )(tu использует ту же
информацию, что и описанный выше.
Покажем, что )(tu является допустимым управлением игрока Р, т.е.
выполняется условие (2). Из условия 2 следует
( ) ( ) ( ) ( )( ) =+≤+= ∫∫∫
ΘΘΘ
0
21
00
)()()()()( dttwftvbdttwtvadttua λλ
( ) ( ) 21
0
2
0
1 )()( λλλλ +≤+= ∫∫
ΘΘ
dttwfdttvb .
Кроме того
( ) MdttwtCzdttvtutCzz ∈+=−+=Θ ∫∫
ΘΘ
0
0
0
0 )()()()()()( .
Теорема доказана.
Линейные дифференциальные игры с разнотипными интегральными ограничениями
Системні дослідження та інформаційні технології, 2002, 1 145
3. ПОСТРОЕНИЕ УПРАВЛЕНИЯ УБЕГАЮЩЕГО ИГРОКА
Рассмотрим игру с динамикой (1) и ограничениями (3), (4).
Теорема 2. Пусть MPz Θ∉0 . Тогда существуют такое число 0>h и
такие отображения nn EEv →:* и [ ] [ ]Θ→Θ ;0;: hϕ , что
1) tt <)(ϕ для [ )Θ∈ ;ht , ( ) Θ=Θϕ ;
2) ( )( ))(* tuv ϕ –– допустимое управление игрока Е, если )(tu ―
допустимое управление игрока Р;
3) для решения уравнения (1) с начальным условием 0)0( zz = , которое
соответствует произвольному допустимому управлению )(tu игрока Р и
управлению
[ )
( )( ) [ ]⎩
⎨
⎧
Θ∈
∈
=
;,)(
,;0,0
)(
* httuv
ht
tv
ϕ
игрока Е выполняется Mz ∉Θ)( .
Доказательство. Построим отображение )(* uv . Пусть u ― произвольный
вектор. Положим
)(1 ua
uu = . Так как 1)(
)(
1
)(
)( 1 ==⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
= ua
uaua
uaua , то
Uu ∈1 . Из условия 1 следует существование таких Vuv ∈)( 11 и Wuw ∈)( 11 ,
что )()( 11111 uwuvu += .
Отсюда
)()()()( 1111 uwuauvuau += ,
или
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
+⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
)(
)(
)(
)( 11 ua
uwua
ua
uvuau .
Обозначим
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
)(
)()(,
)(
)()( 1*1* ua
uwuauw
ua
uvuauv .
В случае 0=u полагаем 0)0()0( ** == wv .
Число 0>h будет указано ниже, а в качестве )(tϕ выберем функцию
h
htt
−Θ
−Θ
=
)()(ϕ . Поскольку в дальнейшем h будет выбираться достаточно
малым и, следовательно, Θ<h , то нетрудно видеть, что tt <)(ϕ при Θ<t и
Θ=Θ)(ϕ .
Покажем, что функция
[ )
( )( ) [ ]⎩
⎨
⎧
Θ∈
∈
=
;,)(
,;0,0
)(
* httuv
ht
tv
ϕ
является допустимым управлением игрока Е.
Известно (см., например [4]), что )( 11 uv и )( 11 uw можно выбрать таким
образом, что ))(( 11 tuv и ))(( 11 tuw будут измеримыми функциями, если
−)(1 tu измеримая функция. Поэтому )(tv является измеримой функцией,
В.В. Остапенко, И.Л. Рыжкова
ISSN 1681–6048 System Research & Information Technologies, 2002, 1 146
если )(tu –– допустимое управление игрока Р. Покажем теперь, что )(tv
удовлетворяет ограничению (4). Так как Vuv ∈)( 11 и, следовательно,
( ) 1)( 11 ≤uvb , то
( ) ( )( )( ) == ∫∫
Θ
∗
Θ
h
dttuvbdttvb )()(
0
ϕ
( )( ) ( )
( )( ) ( )( )∫∫
ΘΘ
≤⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=
hh
dttuadt
tua
tuvbtua )(
)(
)()( 1 ϕ
ϕ
ϕϕ .
Проведем в последнем интеграле замену переменных, положив )(tϕτ = .
Очевидно, что τdhdt
Θ
−Θ
= и Θ≤≤τ0 .
Поэтому
( ) ( )( ) ( ) 1)()()(
00
≤
Θ
−Θ
≤
Θ
−Θ
=≤ ∫∫∫
ΘΘΘ hduahdttuadttvb
h
ττϕ .
Таким образом, при построении управления )(tv используется
информация о tssu <),( . Информация о начальной позиции 0z будет
использоваться ниже при выборе 0>h . Точное построение согласуется с
описанием стратегии игрока Е, данным при постановке задачи.
Перейдем теперь к выбору 0>h . Так как MPz Θ∉0 , то ( ) =+ MWz ∩~
0
∅= . Так как M — замкнутое множество, а Wz ~
0 + — компакт, то
существует ε -окрестность множества Wz ~
0 + , которая не пересекается
с множеством M .
Пусть )(tz –– траектория с началом в 0z , соответствующая )(tu и
управлению )(tv , которое было построено по )(tu выше. Тогда
( ) ( )( )∫∫
ΘΘ
+−+=−+=Θ
h
hDdttvtutCzdttvtutCzz )()()()()()()()( 0
0
0 ϕ ,
где ( )∫∫
ΘΘ
−=
h
dttutCdttutChD )()()()()(
0
ϕ .
Оценим вектор )(hD , проведя во втором интеграле замену переменных
)(tϕτ = .
( ) =−= ∫∫
ΘΘ
h
dttutCdttutChD )()()()()(
0
ϕ
≤⎟
⎠
⎞
⎜
⎝
⎛ +
Θ
−Θ
Θ
−Θ
−= ∫∫
ΘΘ
00
)()()( τττ duhhChdttutC
∫∫
ΘΘ
≤⎟
⎠
⎞
⎜
⎝
⎛ +
Θ
−Θ
Θ
−Θ
−≤
00
)()()()( dttuhddttuhthChtC ,
Линейные дифференциальные игры с разнотипными интегральными ограничениями
Системні дослідження та інформаційні технології, 2002, 1 147
где ⎟
⎠
⎞
⎜
⎝
⎛ +
Θ
−Θ
Θ
−Θ
−=
Θ≤≤
hthChtChd
t
)(max)(
0
.
Из (6) следует ( )
1010
1)(1)(
a
dttua
a
dttu ≤≤ ∫∫
ΘΘ
. Поэтому ( )
1
)(
a
hdhD ≤ . Так
как 0)( →hd при 0→h , то существует такое h , что ε<
1
)(
a
hd .
Из построения *),( vtv и *w следует
( )( ) ( ) ( )( )( ) =−+=−+=Θ ∫∫
ΘΘ
hh
dttuvtutCzdttvtutCzz )()()()()()()(~
*00 ϕϕϕ
( )( ) ∫∫
ΘΘ
+=+=
0
0*0 )()()()( dttwtCzdttuwtCz
h
ϕ ,
где
[ )
( )( ) [ ]⎩
⎨
⎧
Θ∈
∈
=
.,,)(
,;0,0
)(
* httuw
ht
tw
ϕ
Также как и для функции )(tv доказывается, что ( ) 1)(
0
≤∫
Θ
dttwf .
Поэтому Wzz ~)(~
0 +∈Θ .
Так как ε<)(hD и )()(~)( hDzz +Θ=Θ , то )(Θz находится в
ε -окрестности )(~ Θz , а значит и в ε -окрестности множества Wz ~
0 + . Таким
образом , Mz ∉Θ)( и теорема доказана.
4. ОБСУЖДЕНИЕ ПОСТАНОВКИ ЗАДАЧИ
Рассмотрим игру с динамикой
)()( BvAutCz −= , (7)
где nqnp EEBEEA →→ :,: — линейные отображения. Предположим,
что допустимые управления игроков Р и Е удовлетворяют соответственно
условиям
ρ≤∫
Θ
0
)( dttu , (8)
σ≤∫
Θ
0
)( dttv . (9)
Покажем, что в такой постановке игра (7) – (9) сводится к игре (1), (2) (или
(3)), (4). Рассмотрим случай, когда nqnp ≥≥ , и отображения A и B
имеют полный ранг n . Положим
BvvAuu =′=′ , . (10)
В.В. Остапенко, И.Л. Рыжкова
ISSN 1681–6048 System Research & Information Technologies, 2002, 1 148
Обозначим +A и +B –– псевдообратные операторы операторов A и B
соответственно. Известно, что решения уравнений (10) вида vBvuAu ′=′= ++ ,
являются решениями с минимальной нормой. Поэтому игру (7) – (9) можно
заменить игрой с динамикой
))(( vutCz ′−′=
и ограничениями
ρ≤′∫
Θ
+
0
)( dttuA , (11)
σ≤′∫
Θ
+
0
)( dttvB . (12)
Положив теперь vBvbuAua ′=′′=′ ++
σρ
1)(,1)( , приходим к ограни-
чениям (3), (4).
Рассмотрим условия 1 и 2. В пункте 1 при постановке задачи функции
)(ua и )(vb , задающие интегральные ограничения, строились по
множествам U и V . Предположим теперь, что функции )(ua и )(vb заданы
первоначально и удовлетворяют условиям: являются выпуклыми,
положительно однородными, неотрицательными и равными нулю только в
точке 0. Множества U и V зададим функциями
{ } { }1)(:,1)(: ≤∈=≤∈= vbEvVuaEuU nn .
Из условий, наложенных на функции )(ua и )(vb , следует, что
множества U и V являются выпуклыми компактами и содержат ноль в
качестве внутренней точки. Известно, что функции )(ua и )(vb будут
соответственно функциями Минковского этих множеств. Положим
VUW *= (W является геометрической разностью множеств U и V [2], т.е.
}:{ UVxExW n ⊂+∈= ). Предположим, что 0/≠W . Известно [2], что для
любых выпуклых множеств из уравнения WVU += вытекает уравнение
VUW *= , но из уравнения VUW *= вытекает лишь включение
UWV ⊂+ . Выполнения этого включения недостаточно для доказательства
теоремы 2. Таким образом, условие 1 является существенным ограничением
и связывает определенным образом функции )(ua и )(vb .
Рассмотрим пример, в котором выполняется условие 1. Предположим,
что существует функция nExxd ∈),( , и положительные числа ρ и σ такие,
что σρ > и
)(1)(),(1)( vdvbudua
σρ
== . (13)
В этом случае ограничения (3), (4) имеют вид
Линейные дифференциальные игры с разнотипными интегральными ограничениями
Системні дослідження та інформаційні технології, 2002, 1 149
( ) ( ) σρ ≤≤ ∫∫
ΘΘ
00
)(,)( dttvddttud . (14)
Такие ограничения назовем однотипными.
Согласно (13), в данном случае
{ } { }σρ ≤∈=≤∈= )(:,)(: vdEvVudEuU nn .
Положим
{ }σρ −≤∈= )(: udEwW n
и покажем, что для этих множеств VU , и W выполняется условие 1.
Действительно, для любых Vv∈ и Ww∈ истинно неравенство
ρσρσ =−+≤+≤+ )()()()( wdvdwvd .
Таким образом, Uwv ∈+ или UWV ⊂+ .
Пусть теперь Uu∈ . Положим uwuv
σ
σρ
ρ
σ −
== , . Тогда wvu += .
Кроме того σ
ρ
σ
≤= )()( udvd и σρ
σ
σρ
−≤
−
= )()( udwd , т.е. WwVv ∈∈ , .
Таким образом , WVU +⊂ .
Рассмотрим теперь условие 2 и оценим константы 1λ и 2λ . Из
выпуклости и положительной однородности функции )(ua следует
)()()(
)(
)()(
)(
)()()()( 21 wfvbwf
wf
wavb
vb
vawavawva λλ +≤+=+≤+ , (15)
где
)(
)(max,
)(
)(max
0
2
0
1 wf
wa
vb
va
wv ≠≠
== λλ . (16)
В (15) учтен тот факт, что 0)( >xb и 0)( >xf при 0≠x . В случаях,
когда один из векторов v и w или они оба равны нулю, равенство в (15) не
является корректным, однако, очевидно, что и в этом случае конечная
оценка остается справедливой.
Изучим константы 1λ и 2λ . Рассмотрим для примера 1λ . Отметим, что
определение, данное формулой (16), корректно, поскольку максимум
достигается. Действительно, в силу положительной однородности )(ua и
)(vb ,
)(
)(max
)(
)(supsup
)(
)(sup
1100 vb
va
vb
va
v
vb
v
va
vb
va
vvvv ==≠≠
==
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
= . (17)
В.В. Остапенко, И.Л. Рыжкова
ISSN 1681–6048 System Research & Information Technologies, 2002, 1 150
Последнее равенство справедливо в силу компактности множества
{ }1: =∈ vEv n и непрерывности функции
)(
)(
vb
va . Аналогично (17) можно
получить следующее выражение для 1λ :
)(max
)(
)(
max
1)(0
1 va
vb
vb
vb
va
vbv =≠
=
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
=λ . (18)
Поскольку для любого 1)( ≤∈ vbVv , то ⎟⎟
⎠
⎞
⎜⎜
⎝
⎛
≤
)(
)(
vb
vava и, следовательно,
из (18) следует
{ } { }UVUvva
VvVv
λλλλλ ⊂=∈==
∈∈
:min:minmax)(max1 . (19)
Аналогично
{ }UW λλλ ⊂= :min2 . (20)
Из (19) и (20) нетрудно вывести оценку для числа 21 λλ + .
Действительно, из (19) и (20) следует, что UV 1λ⊂ и UW 2λ⊂ . Отсюда в
силу выпуклости U ,
UUUWVU )( 2121 λλλλ +=+⊂+= .
Так как Uint0∈ , то
121 ≥+λλ . (21)
Покажем, что в случае однотипности ограничений (формулы (13), (14))
неравенство (21) превращается в равенство. В этом случае
)(1)( wdwf
σρ −
= и
ρ
σρλ
ρ
σλ −
====
≠≠ )(
)(max,
)(
)(max
0
2
0
1 wf
wa
vb
va
wv
. Отсюда
121 =+λλ .
Рассмотрим примеры, в которых вычислены конкретные значения 1λ и
2λ . Ниже будут рассмотрены случаи, когда 2=n .
Пример 1 . Пусть
{ },22,33:),( 2121 ≤≤−≤≤−== uuuuuU
{ },11,22:),( 2121 ≤≤−≤≤−== vvvvvV
{ }2,1,11:),( 21 =≤≤−== iwwwwW i .
Нетрудно видеть, что выполняется условие 1. С помощью формул (19), (20)
можно получить
2
1,
3
2
21 == λλ . Отсюда
6
7
21 =+λλ .
Пример 2 . Пусть
{ },33,42:),( 2121 ≤≤−≤≤−== uuuuuU
Линейные дифференциальные игры с разнотипными интегральными ограничениями
Системні дослідження та інформаційні технології, 2002, 1 151
{ },22,31:),( 2121 ≤≤−≤≤−== vvvvvV
{ }.2,1,11:),( 21 =≤≤−== iwwwwW i
В этом случае из формул (19), (20) можно получить
2
1,
4
3
21 == λλ . Отсюда
4
5
21 =+λλ .
5. РАЗНЫЕ КЛАССЫ ЛИНЕЙНЫХ ИГР
Рассмотрим пространство mE , в котором изменяется x и пространство nE
такое, что mn ≤ . Пусть mn EE →:ϕ — линейный оператор вложения;
nm EE →:π — линейное отображение; A — линейный оператор в mE ;
параметры nEvu ∈, . Динамика рассматриваемых игр описывается
уравнением
)( vuAxx −+= ϕ . (22)
Терминальное множество 0M задается в виде { }MxExM m ∈∈= π:0 ,
где M –– замкнутое подмножество в nE . Цель игрока Р вывести
траекторию системы (22) на множество 0M в момент 0>Θ . Цель игрока Е
противоположная.
Положим
ϕπππ )(
00 )(),()(, tAA etCxzxez −ΘΘ =Θ=Θ= .
В этих обозначениях запишем
( )∫
Θ
−+=Θ
0
0 )()()()( dttvtutCzz .
Таким образом, исходная игра, описанная уравнением (22) и терминальным
множеством 0M , сводится к игре, описанной уравнением (1) и
терминальным множеством M .
В [4] указан способ использования операторов π и ϕ для описания
различных классов линейных игр.
Пример 3 . Пусть mn = и −ϕπ , тождественные операторы. Тогда
уравнение (22) имеет вид
vuAxx −+=
и )()( tAetC −Θ= .
Пример 4 . Рассмотрим игру с динамикой
vuyDy −+= , (23)
где DEy n ,∈ –– матрица размерности nn× . Уравнение (23) перепи-
сывается в виде
В.В. Остапенко, И.Л. Рыжкова
ISSN 1681–6048 System Research & Information Technologies, 2002, 1 152
⎪⎩
⎪
⎨
⎧
−+=
=
.
,
11
1
vuyDy
yy
В качестве x рассматривается вектор nE
y
y
x 2
1 ∈⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
= .
Операторы π,A и ϕ имеют вид
[ ] ⎥
⎦
⎤
⎢
⎣
⎡
==⎥
⎦
⎤
⎢
⎣
⎡
=
E
E
D
E
A
0
,0,
0
0
ϕπ ,
где −E единичная матрица размерности nn× . В этом случае считая, что
⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
= 1
0
0
0
y
y
x , получаем 1
0
0
00 ydseyz Ds∫
Θ
+= и ∫
−Θ
=
t
DsdsetC
0
)( .
Пример 5 . Рассмотрим игру с динамикой
vuDyy −+−= , (24)
где DEy n ;∈ –– матрица размерности nn× . Уравнение (24) перепишем в
виде
⎪⎩
⎪
⎨
⎧
−+−=
=
,
,
1
1
vuyDy
yy
вектор ⎟
⎟
⎠
⎞
⎜
⎜
⎝
⎛
= 1y
y
x . Операторы π и ϕ имеют тот же вид, что и в примере 4, а
оператор ⎥
⎦
⎤
⎢
⎣
⎡
−
=
0
0
D
E
A . В этом примере
( ) ( ) ( ) 1
0
1
00 sincos yDDyDz Θ+Θ=
−
,
( ) ( ))(sin)(
1
tDDtC −Θ=
−
,
где cos и sin в последних формулах формально обозначают ряды
( ) ...,
!4
1
!2
1cos 422 −Θ+Θ−=Θ DDED
( ) ( ) ....
!5
1
!3
1sin 5221
−Θ+Θ−=Θ
−
DDEtDD
ЛИТЕРАТУРА
1. Айзекс Р. Дифференциальные игры. –– М.: Мир, 1967. –– 479 c.
2. Понтрягин Л.С. Избранные научные труды. Т. 2. Дифференциальные
уравнения. Теория операторов. Оптимальное управление. Дифференциальные
игры. –– М.: Наука. 1988. –– 576 с.
3. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. ––
М.: Наука, 1974. –– 456 с.
Линейные дифференциальные игры с разнотипными интегральными ограничениями
Системні дослідження та інформаційні технології, 2002, 1 153
4. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. – Киев: Наук.
думка, 1992. –– 264 с.
5. Чикрий А.А. Конфликтно управляемые процессы. – Киев: Наук. думка. ––
1992. –– 382 с.
6. Никольский М.С. Прямой метод в линейных дифференциальных играх с
интегральными ограничениями // Управляемые системы. Изд-во СО АН
СССР. –– 1969. –– Вып. 2. –– С. 53–60.
7. Азимов А.Я. Об одном способе преследования в линейных дифференциальных
играх с интегральными ограничениями // Изв. АН СССР. –– Сер. Техн.
кибернетика. –– 1974. –– № 2. – С. 31–35.
8. Пшеничный Б.Н., Онопчук Ю.Н. Линейные дифференциальные игры с
интегральными ограничениями // Изв. АН СССР. –– Сер. Техн.
кибернетика. –– 1968. –– № 1. –– С. 13–22.
9. Онопчук Ю.Н. О дифференциальных играх с интегральными ограничениями //
Тр. семинара «Теория оптимальных решений». –– Киев: ИК АН УССР,
1967. — № 2. –– С. 45–55.
10. Никольский М.С. Об одном классе дифференциальных игр // Тр. семинара
«Теория оптимальных решений». — Киев: ИК АН УССР, 1968. –– № 2. ––
С. 3-13.
11. Гусятников П.Б., Никольский М.С. К проблеме оптимальности времени
преследования // Теория оптимальных решений. –– Киев: ИК АН УССР.
―1969. –– № 3. –– С.3–21.
12. Остапенко В.В., Рижкова І.Л. Про лінійну диференціальну гру з фіксованим
часом закінчення та обмеженнями на ресурси // Кибернетика и системный
анализ. ― 2000. ― №4. ― С.178–183.
Поступила 10.10.2001
|