Линейные дифференциальные игры с разнотипными интегральными ограничениями

Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управлен...

Повний опис

Збережено в:

Бібліографічні деталі
Дата:	2002
Автори:	Остапенко, В.В., Рыжкова, И.Л.
Формат:	Стаття
Мова:	Russian
Опубліковано:	Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2002
Назва видання:	Системні дослідження та інформаційні технології
Теми:	Математичні методи, моделі, проблеми і технології дослідження складних систем
Онлайн доступ:	http://dspace.nbuv.gov.ua/handle/123456789/50218
Теги:	Додати тег Немає тегів, Будьте першим, хто поставить тег для цього запису!
Назва журналу:	Digital Library of Periodicals of National Academy of Sciences of Ukraine
Цитувати:	Линейные дифференциальные игры с разнотипными интегральными ограничениями / В.В. Остапенко, И.Л. Рыжкова // Систем. дослідж. та інформ. технології. — 2002. — № 1. — С. 141-153. — Бібліогр.: 12 назв. — рос.

Репозитарії

Digital Library of Periodicals of National Academy of Sciences of Ukraine

id	irk-123456789-50218
record_format	dspace
spelling	irk-123456789-502182013-10-07T03:06:33Z Линейные дифференциальные игры с разнотипными интегральными ограничениями Остапенко, В.В. Рыжкова, И.Л. Математичні методи, моделі, проблеми і технології дослідження складних систем Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управление, зная управление убегающего, а убегающий в каждый момент времени использует информацию о действиях противника в прошлом. Розглянуто лінійні диференціальні ігри з інтегральними обмеженнями на керування гравців з фіксованим часом закінчення. Умови повного вимітання, що були сформульовані для випадку геометричних обмежень, перенесено на випадок інтегральних обмежень. Доганяючий гравець будує своє керування, знаючи керування втікача, а утікач, в кожний момент часу використовує інформацію про дії супротивника в минулому. The linear differential game with integral restriction on players’ controls with fixed finishing time are considered in this paper. Соnditions of full sweepness that were formulated for the geometric restrictions case are transformed to integral restrictions case. Pursuer builds its control knowing escaper’s control, but escaper uses information about action of opponent in past in each moment of time. 2002 Article Линейные дифференциальные игры с разнотипными интегральными ограничениями / В.В. Остапенко, И.Л. Рыжкова // Систем. дослідж. та інформ. технології. — 2002. — № 1. — С. 141-153. — Бібліогр.: 12 назв. — рос. 1681–6048 http://dspace.nbuv.gov.ua/handle/123456789/50218 518.9 ru Системні дослідження та інформаційні технології Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
institution	Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection	DSpace DC
language	Russian
topic	Математичні методи, моделі, проблеми і технології дослідження складних систем Математичні методи, моделі, проблеми і технології дослідження складних систем
spellingShingle	Математичні методи, моделі, проблеми і технології дослідження складних систем Математичні методи, моделі, проблеми і технології дослідження складних систем Остапенко, В.В. Рыжкова, И.Л. Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології
description	Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управление, зная управление убегающего, а убегающий в каждый момент времени использует информацию о действиях противника в прошлом.
format	Article
author	Остапенко, В.В. Рыжкова, И.Л.
author_facet	Остапенко, В.В. Рыжкова, И.Л.
author_sort	Остапенко, В.В.
title	Линейные дифференциальные игры с разнотипными интегральными ограничениями
title_short	Линейные дифференциальные игры с разнотипными интегральными ограничениями
title_full	Линейные дифференциальные игры с разнотипными интегральными ограничениями
title_fullStr	Линейные дифференциальные игры с разнотипными интегральными ограничениями
title_full_unstemmed	Линейные дифференциальные игры с разнотипными интегральными ограничениями
title_sort	линейные дифференциальные игры с разнотипными интегральными ограничениями
publisher	Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
publishDate	2002
topic_facet	Математичні методи, моделі, проблеми і технології дослідження складних систем
url	http://dspace.nbuv.gov.ua/handle/123456789/50218
citation_txt	Линейные дифференциальные игры с разнотипными интегральными ограничениями / В.В. Остапенко, И.Л. Рыжкова // Систем. дослідж. та інформ. технології. — 2002. — № 1. — С. 141-153. — Бібліогр.: 12 назв. — рос.
series	Системні дослідження та інформаційні технології
work_keys_str_mv	AT ostapenkovv linejnyedifferencialʹnyeigrysraznotipnymiintegralʹnymiograničeniâmi AT ryžkovail linejnyedifferencialʹnyeigrysraznotipnymiintegralʹnymiograničeniâmi
first_indexed	2025-07-04T11:47:23Z
last_indexed	2025-07-04T11:47:23Z
_version_	1836716807196508160
fulltext	© В.В. Остапенко, И.Л. Рыжкова Системні дослідження та інформаційні технології, 2002, 1 141 УДК 518.9 ЛИНЕЙНЫЕ ДИФФЕРЕНЦИАЛЬНЫЕ ИГРЫ С РАЗНОТИПНЫМИ ИНТЕГРАЛЬНЫМИ ОГРАНИЧЕНИЯМИ В.В. ОСТАПЕНКО, И.Л. РЫЖКОВА Рассмотрены линейные дифференциальные игры с интегральными ограничениями на управления игроков и с фиксированным временем окончания. Условия полного выметания, сформулированные для случая геометрических ограничений, перенесены на случай интегральных ограничений. Догоняющий игрок строит свое управление, зная управление убегающего, а убегающий в каждый момент времени использует информацию о действиях противника в прошлом. ВВЕДЕНИЕ Современная теория дифференциальных игр в основном развивается как теория управляемых динамических систем с геометрическими ограничениями на управления игроков [1–5]. Были описаны структуры дифференциальных игр; исследованы различные способы задания стратегий игроков, при которых игроки не знают управления противника в будущем; разработаны общие подходы и конкретные методы решения различных классов дифференциальных игр. Вместе с тем работы ряда авторов [6–9] показывают, что перенесение методов, разработанных для игр с геометрическими ограничениями, на игры с интегральными ограничениями является непростой задачей. Это связано с тем, что класс управляющих функций, удовлетворяющих интегральному ограничению, не обладает важными свойствами, которыми обладает класс управлений, удовлетворяющих геометрическому ограничению. Так, например, подход к описанию структуры игры, основанный на операторных конструкциях Б.Н. Пшеничного [4], не переносится непосредственно на игры с интегральными ограничениями. Поэтому актуальным остается вопрос обобщения известных методов теории дифференциальных игр на игры с интегральными ограничениями. В работах [10, 11] создан метод, позволяющий сводить дифференциальную игру к обычной задаче управления. При этом важную роль играет условие полного выметания, которое накладывается на области управления игроков. В работе [12] это условие заменялось однотипностью интегральных ограничений для обоих игроков. Данная статья обобщает результаты, полученные в [12]. В ней рассматриваются разнотипные интегральные ограничения, связанные между собой аналогом условия полного выметания. В.В. Остапенко, И.Л. Рыжкова ISSN 1681–6048 System Research & Information Technologies, 2002, 1 142 1. ПОСТАНОВКА ЗАДАЧИ Рассмотрим дифференциальную игру, динамика которой описывается уравнением )()( vutCz −= , (1) где ;,, nEvuz ∈ nE — n-мерное евклидово пространство; )(tC –– семейство линейных операторов, действующих в nE , непрерывных на отрезке [ ]Θ;0 ; 0>Θ –– фиксированный момент времени. Игрок Р (догоняющий) распоряжается параметром u , игрок Е (убегающий) –– параметром v . Цель игрока Р –– добиться включения Mz ∈Θ)( ; цель игрока Е –– противоположная. Терминальное множество М является замкнутым подмножеством пространства nE . Будем предполагать, что игрок Р при выборе в момент времени t управления )(tu знает начальную позицию 0)0( zz = и текущее управление )(tv игрока Е. Игрок Е в момент времени t выбирает )(tv , зная 0)0( zz = и управление игрока Р )(su при ts < . Опишем интегральные ограничения на управления игроков с помощью некоторых выпуклых множеств и их функций Минковского. Пусть VU , и W –– выпуклые компактные подмножества пространства nE , имеющие непустую внутренность и содержащие ноль в качестве внутренней точки. В дальнейшем будет использоваться следующее условие. Условие 1 WVU += . Условие 1 является условием полного выметания для множеств U и V . Напомним, что функция Минковского )/( Axµ выпуклого множества nEA⊂ такого, что Aint0∈ , определяется по формуле: { }AxAx λλµ ∈>= :0inf)/( . Отметим, что для замкнутого выпуклого множества A справедлива формула { }1)/(: ≤= AxxA µ . Обозначим )/()(),/()( VvvbUuua µµ == , )/()( Wwwf µ= . Отметим, что функции )(),( vbua и )(wf как функции Минковского некоторых множеств являются выпуклыми, положительно однородными. Условие 2. Существуют такие числа 0, 21 >λλ , что для всех nEwv ∈, выполняется неравенство )()()( 21 wfvbwva λλ +≤+ . Ниже будет описан способ получения коэффициентов 1λ и 2λ и рассмотрены примеры, в которых рассчитаны конкретные значения 1λ и 2λ . Согласно изложенному ниже способу, 121 ≥+λλ . Рассмотрим два интегральных ограничения на управления игрока Р Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології, 2002, 1 143 ( ) 21 0 )( λλ +≤∫ Θ dttua , (2) ( ) 1)( 0 ∫ Θ ≤dttua . (3) Интегральное ограничение на управление игрока Е имеет вид ( ) 1)( 0 ∫ Θ ≤dttvb . (4) Управления )(tu и )(tv , удовлетворяющие ограничениям (2) или (3) и (4), будем называть допустимыми управлениями игроков Р и Е соответственно. В статье рассматривается игра с двух разных позиций: с позиции догоняющего и с позиции убегающего. В первом случае используется ограничение вида (2), во втором ― вида (3). Введем множество W~ , которое используется при формулировке результатов ( ) ⎪⎭ ⎪ ⎬ ⎫ ⎪⎩ ⎪ ⎨ ⎧ ≤= ∫∫ ΘΘ 1)(:)()(~ 00 dttwfdttwtCW ∪ , т.е. W~ является множеством всех обычных интегралов вида ∫ Θ 0 )()( dttwtC , где )(tw — измеримая функция, удовлетворяющая ограничению ( ) 1)( 0 ∫ Θ ≤dttwf . (5) Следует отметить, что функции )(),( tvtu и )(tw , удовлетворяющие соответственно ограничениям (2) – (5), принадлежат классу ];0[1 ΘL . Действительно, рассмотрим для примера ограничение (3). Так как функция )(ua выпукла и +∞<)(ua для всех nEu∈ , то )(ua непрерывна. Поскольку Uint0∈ , то 0)( >ua для всех 0≠u . Поэтому 0)(min 1 1 >= = aua u . Отсюда для любого 1a u uaEu n ≥⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ∈ и в силу положительной однородности )(ua получаем )(1 1 ua a u ≤ . Из этого неравенства вытекает ( ) +∞<≤≤ ∫∫ ΘΘ 1010 1)(1)( a dttua a dttu . (6) В силу условий, наложенных на семейство операторов )(tC , управление (1) имеет решение при любых допустимых управлениях игроков В.В. Остапенко, И.Л. Рыжкова ISSN 1681–6048 System Research & Information Technologies, 2002, 1 144 и, кроме того, каждый интеграл, входящий в определение множества W~ , имеет смысл. Кроме того, нетрудно видеть, что множество W~ является замкнутым и ограниченным, т.е. компактным. В дальнейшем всюду будем предполагать выполнение условий 1 и 2. 2. ПОСТРОЕНИЕ УПРАВЛЕНИЯ ДОГОНЯЮЩЕГО ИГРОКА Рассмотрим игру с динамикой (1) и ограничениями (2), (4). Обозначим WMMP ~ −=Θ . Теорема 1. Пусть MPz Θ∈0 . Тогда существует отображение nn EEu →+ ∗ 1: такое, что для любого допустимого управления )(tv игрока Е выполняется: а) ( )−ttvu ),(* допустимое управление игрока Р; б) для решения )(tz уравнения (1) с начальным условием 0)0( zz = , которое соответствует управлениям ( )ttvu ),(* и )(tv , справедливо включение Mz ∈Θ)( . Доказательство. Из определения множества W~ следует, что если MPz Θ∈0 , то существует функция )(tw , удовлетворяющая ограничению (5) такая, что MdttwtCz ∈+ ∫ Θ 0 0 )()( . Положим ( ) )(,* twvtvu += . Пусть −)(tv произвольное допустимое управление игрока Е. Тогда управление игрока Р имеет вид ( ) )()(),()( * twtvttvutu +== . Отметим, что значение )(tu строится на основании информации о функциях )(tv и )(tw . Функция )(tw строится по начальной позиции 0z . Таким образом, данный способ построения управления )(tu использует ту же информацию, что и описанный выше. Покажем, что )(tu является допустимым управлением игрока Р, т.е. выполняется условие (2). Из условия 2 следует ( ) ( ) ( ) ( )( ) =+≤+= ∫∫∫ ΘΘΘ 0 21 00 )()()()()( dttwftvbdttwtvadttua λλ ( ) ( ) 21 0 2 0 1 )()( λλλλ +≤+= ∫∫ ΘΘ dttwfdttvb . Кроме того ( ) MdttwtCzdttvtutCzz ∈+=−+=Θ ∫∫ ΘΘ 0 0 0 0 )()()()()()( . Теорема доказана. Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології, 2002, 1 145 3. ПОСТРОЕНИЕ УПРАВЛЕНИЯ УБЕГАЮЩЕГО ИГРОКА Рассмотрим игру с динамикой (1) и ограничениями (3), (4). Теорема 2. Пусть MPz Θ∉0 . Тогда существуют такое число 0>h и такие отображения nn EEv →:* и [ ] [ ]Θ→Θ ;0;: hϕ , что 1) tt <)(ϕ для [ )Θ∈ ;ht , ( ) Θ=Θϕ ; 2) ( )( ))(* tuv ϕ –– допустимое управление игрока Е, если )(tu ― допустимое управление игрока Р; 3) для решения уравнения (1) с начальным условием 0)0( zz = , которое соответствует произвольному допустимому управлению )(tu игрока Р и управлению [ ) ( )( ) [ ]⎩ ⎨ ⎧ Θ∈ ∈ = ;,)( ,;0,0 )( * httuv ht tv ϕ игрока Е выполняется Mz ∉Θ)( . Доказательство. Построим отображение )(* uv . Пусть u ― произвольный вектор. Положим )(1 ua uu = . Так как 1)( )( 1 )( )( 1 ==⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = ua uaua uaua , то Uu ∈1 . Из условия 1 следует существование таких Vuv ∈)( 11 и Wuw ∈)( 11 , что )()( 11111 uwuvu += . Отсюда )()()()( 1111 uwuauvuau += , или ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ +⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = )( )( )( )( 11 ua uwua ua uvuau . Обозначим ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ =⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = )( )()(, )( )()( 11 ua uwuauw ua uvuauv . В случае 0=u полагаем 0)0()0( ** == wv . Число 0>h будет указано ниже, а в качестве )(tϕ выберем функцию h htt −Θ −Θ = )()(ϕ . Поскольку в дальнейшем h будет выбираться достаточно малым и, следовательно, Θ<h , то нетрудно видеть, что tt <)(ϕ при Θ<t и Θ=Θ)(ϕ . Покажем, что функция [ ) ( )( ) [ ]⎩ ⎨ ⎧ Θ∈ ∈ = ;,)( ,;0,0 )( * httuv ht tv ϕ является допустимым управлением игрока Е. Известно (см., например [4]), что )( 11 uv и )( 11 uw можно выбрать таким образом, что ))(( 11 tuv и ))(( 11 tuw будут измеримыми функциями, если −)(1 tu измеримая функция. Поэтому )(tv является измеримой функцией, В.В. Остапенко, И.Л. Рыжкова ISSN 1681–6048 System Research & Information Technologies, 2002, 1 146 если )(tu –– допустимое управление игрока Р. Покажем теперь, что )(tv удовлетворяет ограничению (4). Так как Vuv ∈)( 11 и, следовательно, ( ) 1)( 11 ≤uvb , то ( ) ( )( )( ) == ∫∫ Θ ∗ Θ h dttuvbdttvb )()( 0 ϕ ( )( ) ( ) ( )( ) ( )( )∫∫ ΘΘ ≤⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ = hh dttuadt tua tuvbtua )( )( )()( 1 ϕ ϕ ϕϕ . Проведем в последнем интеграле замену переменных, положив )(tϕτ = . Очевидно, что τdhdt Θ −Θ = и Θ≤≤τ0 . Поэтому ( ) ( )( ) ( ) 1)()()( 00 ≤ Θ −Θ ≤ Θ −Θ =≤ ∫∫∫ ΘΘΘ hduahdttuadttvb h ττϕ . Таким образом, при построении управления )(tv используется информация о tssu <),( . Информация о начальной позиции 0z будет использоваться ниже при выборе 0>h . Точное построение согласуется с описанием стратегии игрока Е, данным при постановке задачи. Перейдем теперь к выбору 0>h . Так как MPz Θ∉0 , то ( ) =+ MWz ∩~ 0 ∅= . Так как M — замкнутое множество, а Wz ~ 0 + — компакт, то существует ε -окрестность множества Wz ~ 0 + , которая не пересекается с множеством M . Пусть )(tz –– траектория с началом в 0z , соответствующая )(tu и управлению )(tv , которое было построено по )(tu выше. Тогда ( ) ( )( )∫∫ ΘΘ +−+=−+=Θ h hDdttvtutCzdttvtutCzz )()()()()()()()( 0 0 0 ϕ , где ( )∫∫ ΘΘ −= h dttutCdttutChD )()()()()( 0 ϕ . Оценим вектор )(hD , проведя во втором интеграле замену переменных )(tϕτ = . ( ) =−= ∫∫ ΘΘ h dttutCdttutChD )()()()()( 0 ϕ ≤⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + Θ −Θ Θ −Θ −= ∫∫ ΘΘ 00 )()()( τττ duhhChdttutC ∫∫ ΘΘ ≤⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + Θ −Θ Θ −Θ −≤ 00 )()()()( dttuhddttuhthChtC , Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології, 2002, 1 147 где ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + Θ −Θ Θ −Θ −= Θ≤≤ hthChtChd t )(max)( 0 . Из (6) следует ( ) 1010 1)(1)( a dttua a dttu ≤≤ ∫∫ ΘΘ . Поэтому ( ) 1 )( a hdhD ≤ . Так как 0)( →hd при 0→h , то существует такое h , что ε< 1 )( a hd . Из построения ),( vtv и w следует ( )( ) ( ) ( )( )( ) =−+=−+=Θ ∫∫ ΘΘ hh dttuvtutCzdttvtutCzz )()()()()()()(~ 00 ϕϕϕ ( )( ) ∫∫ ΘΘ +=+= 0 00 )()()()( dttwtCzdttuwtCz h ϕ , где [ ) ( )( ) [ ]⎩ ⎨ ⎧ Θ∈ ∈ = .,,)( ,;0,0 )( * httuw ht tw ϕ Также как и для функции )(tv доказывается, что ( ) 1)( 0 ≤∫ Θ dttwf . Поэтому Wzz ~)(~ 0 +∈Θ . Так как ε<)(hD и )()(~)( hDzz +Θ=Θ , то )(Θz находится в ε -окрестности )(~ Θz , а значит и в ε -окрестности множества Wz ~ 0 + . Таким образом , Mz ∉Θ)( и теорема доказана. 4. ОБСУЖДЕНИЕ ПОСТАНОВКИ ЗАДАЧИ Рассмотрим игру с динамикой )()( BvAutCz −= , (7) где nqnp EEBEEA →→ :,: — линейные отображения. Предположим, что допустимые управления игроков Р и Е удовлетворяют соответственно условиям ρ≤∫ Θ 0 )( dttu , (8) σ≤∫ Θ 0 )( dttv . (9) Покажем, что в такой постановке игра (7) – (9) сводится к игре (1), (2) (или (3)), (4). Рассмотрим случай, когда nqnp ≥≥ , и отображения A и B имеют полный ранг n . Положим BvvAuu =′=′ , . (10) В.В. Остапенко, И.Л. Рыжкова ISSN 1681–6048 System Research & Information Technologies, 2002, 1 148 Обозначим +A и +B –– псевдообратные операторы операторов A и B соответственно. Известно, что решения уравнений (10) вида vBvuAu ′=′= ++ , являются решениями с минимальной нормой. Поэтому игру (7) – (9) можно заменить игрой с динамикой ))(( vutCz ′−′= и ограничениями ρ≤′∫ Θ + 0 )( dttuA , (11) σ≤′∫ Θ + 0 )( dttvB . (12) Положив теперь vBvbuAua ′=′′=′ ++ σρ 1)(,1)( , приходим к ограни- чениям (3), (4). Рассмотрим условия 1 и 2. В пункте 1 при постановке задачи функции )(ua и )(vb , задающие интегральные ограничения, строились по множествам U и V . Предположим теперь, что функции )(ua и )(vb заданы первоначально и удовлетворяют условиям: являются выпуклыми, положительно однородными, неотрицательными и равными нулю только в точке 0. Множества U и V зададим функциями { } { }1)(:,1)(: ≤∈=≤∈= vbEvVuaEuU nn . Из условий, наложенных на функции )(ua и )(vb , следует, что множества U и V являются выпуклыми компактами и содержат ноль в качестве внутренней точки. Известно, что функции )(ua и )(vb будут соответственно функциями Минковского этих множеств. Положим VUW = (W является геометрической разностью множеств U и V [2], т.е. }:{ UVxExW n ⊂+∈= ). Предположим, что 0/≠W . Известно [2], что для любых выпуклых множеств из уравнения WVU += вытекает уравнение VUW = , но из уравнения VUW *= вытекает лишь включение UWV ⊂+ . Выполнения этого включения недостаточно для доказательства теоремы 2. Таким образом, условие 1 является существенным ограничением и связывает определенным образом функции )(ua и )(vb . Рассмотрим пример, в котором выполняется условие 1. Предположим, что существует функция nExxd ∈),( , и положительные числа ρ и σ такие, что σρ > и )(1)(),(1)( vdvbudua σρ == . (13) В этом случае ограничения (3), (4) имеют вид Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології, 2002, 1 149 ( ) ( ) σρ ≤≤ ∫∫ ΘΘ 00 )(,)( dttvddttud . (14) Такие ограничения назовем однотипными. Согласно (13), в данном случае { } { }σρ ≤∈=≤∈= )(:,)(: vdEvVudEuU nn . Положим { }σρ −≤∈= )(: udEwW n и покажем, что для этих множеств VU , и W выполняется условие 1. Действительно, для любых Vv∈ и Ww∈ истинно неравенство ρσρσ =−+≤+≤+ )()()()( wdvdwvd . Таким образом, Uwv ∈+ или UWV ⊂+ . Пусть теперь Uu∈ . Положим uwuv σ σρ ρ σ − == , . Тогда wvu += . Кроме того σ ρ σ ≤= )()( udvd и σρ σ σρ −≤ − = )()( udwd , т.е. WwVv ∈∈ , . Таким образом , WVU +⊂ . Рассмотрим теперь условие 2 и оценим константы 1λ и 2λ . Из выпуклости и положительной однородности функции )(ua следует )()()( )( )()( )( )()()()( 21 wfvbwf wf wavb vb vawavawva λλ +≤+=+≤+ , (15) где )( )(max, )( )(max 0 2 0 1 wf wa vb va wv ≠≠ == λλ . (16) В (15) учтен тот факт, что 0)( >xb и 0)( >xf при 0≠x . В случаях, когда один из векторов v и w или они оба равны нулю, равенство в (15) не является корректным, однако, очевидно, что и в этом случае конечная оценка остается справедливой. Изучим константы 1λ и 2λ . Рассмотрим для примера 1λ . Отметим, что определение, данное формулой (16), корректно, поскольку максимум достигается. Действительно, в силу положительной однородности )(ua и )(vb , )( )(max )( )(supsup )( )(sup 1100 vb va vb va v vb v va vb va vvvv ==≠≠ == ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = . (17) В.В. Остапенко, И.Л. Рыжкова ISSN 1681–6048 System Research & Information Technologies, 2002, 1 150 Последнее равенство справедливо в силу компактности множества { }1: =∈ vEv n и непрерывности функции )( )( vb va . Аналогично (17) можно получить следующее выражение для 1λ : )(max )( )( max 1)(0 1 va vb vb vb va vbv =≠ = ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ =λ . (18) Поскольку для любого 1)( ≤∈ vbVv , то ⎟⎟ ⎠ ⎞ ⎜⎜ ⎝ ⎛ ≤ )( )( vb vava и, следовательно, из (18) следует { } { }UVUvva VvVv λλλλλ ⊂=∈== ∈∈ :min:minmax)(max1 . (19) Аналогично { }UW λλλ ⊂= :min2 . (20) Из (19) и (20) нетрудно вывести оценку для числа 21 λλ + . Действительно, из (19) и (20) следует, что UV 1λ⊂ и UW 2λ⊂ . Отсюда в силу выпуклости U , UUUWVU )( 2121 λλλλ +=+⊂+= . Так как Uint0∈ , то 121 ≥+λλ . (21) Покажем, что в случае однотипности ограничений (формулы (13), (14)) неравенство (21) превращается в равенство. В этом случае )(1)( wdwf σρ − = и ρ σρλ ρ σλ − ==== ≠≠ )( )(max, )( )(max 0 2 0 1 wf wa vb va wv . Отсюда 121 =+λλ . Рассмотрим примеры, в которых вычислены конкретные значения 1λ и 2λ . Ниже будут рассмотрены случаи, когда 2=n . Пример 1 . Пусть { },22,33:),( 2121 ≤≤−≤≤−== uuuuuU { },11,22:),( 2121 ≤≤−≤≤−== vvvvvV { }2,1,11:),( 21 =≤≤−== iwwwwW i . Нетрудно видеть, что выполняется условие 1. С помощью формул (19), (20) можно получить 2 1, 3 2 21 == λλ . Отсюда 6 7 21 =+λλ . Пример 2 . Пусть { },33,42:),( 2121 ≤≤−≤≤−== uuuuuU Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології, 2002, 1 151 { },22,31:),( 2121 ≤≤−≤≤−== vvvvvV { }.2,1,11:),( 21 =≤≤−== iwwwwW i В этом случае из формул (19), (20) можно получить 2 1, 4 3 21 == λλ . Отсюда 4 5 21 =+λλ . 5. РАЗНЫЕ КЛАССЫ ЛИНЕЙНЫХ ИГР Рассмотрим пространство mE , в котором изменяется x и пространство nE такое, что mn ≤ . Пусть mn EE →:ϕ — линейный оператор вложения; nm EE →:π — линейное отображение; A — линейный оператор в mE ; параметры nEvu ∈, . Динамика рассматриваемых игр описывается уравнением )( vuAxx −+= ϕ . (22) Терминальное множество 0M задается в виде { }MxExM m ∈∈= π:0 , где M –– замкнутое подмножество в nE . Цель игрока Р вывести траекторию системы (22) на множество 0M в момент 0>Θ . Цель игрока Е противоположная. Положим ϕπππ )( 00 )(),()(, tAA etCxzxez −ΘΘ =Θ=Θ= . В этих обозначениях запишем ( )∫ Θ −+=Θ 0 0 )()()()( dttvtutCzz . Таким образом, исходная игра, описанная уравнением (22) и терминальным множеством 0M , сводится к игре, описанной уравнением (1) и терминальным множеством M . В [4] указан способ использования операторов π и ϕ для описания различных классов линейных игр. Пример 3 . Пусть mn = и −ϕπ , тождественные операторы. Тогда уравнение (22) имеет вид vuAxx −+= и )()( tAetC −Θ= . Пример 4 . Рассмотрим игру с динамикой vuyDy −+= , (23) где DEy n ,∈ –– матрица размерности nn× . Уравнение (23) перепи- сывается в виде В.В. Остапенко, И.Л. Рыжкова ISSN 1681–6048 System Research & Information Technologies, 2002, 1 152 ⎪⎩ ⎪ ⎨ ⎧ −+= = . , 11 1 vuyDy yy В качестве x рассматривается вектор nE y y x 2 1 ∈⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = . Операторы π,A и ϕ имеют вид [ ] ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ ==⎥ ⎦ ⎤ ⎢ ⎣ ⎡ = E E D E A 0 ,0, 0 0 ϕπ , где −E единичная матрица размерности nn× . В этом случае считая, что ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = 1 0 0 0 y y x , получаем 1 0 0 00 ydseyz Ds∫ Θ += и ∫ −Θ = t DsdsetC 0 )( . Пример 5 . Рассмотрим игру с динамикой vuDyy −+−= , (24) где DEy n ;∈ –– матрица размерности nn× . Уравнение (24) перепишем в виде ⎪⎩ ⎪ ⎨ ⎧ −+−= = , , 1 1 vuyDy yy вектор ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ = 1y y x . Операторы π и ϕ имеют тот же вид, что и в примере 4, а оператор ⎥ ⎦ ⎤ ⎢ ⎣ ⎡ − = 0 0 D E A . В этом примере ( ) ( ) ( ) 1 0 1 00 sincos yDDyDz Θ+Θ= − , ( ) ( ))(sin)( 1 tDDtC −Θ= − , где cos и sin в последних формулах формально обозначают ряды ( ) ..., !4 1 !2 1cos 422 −Θ+Θ−=Θ DDED ( ) ( ) .... !5 1 !3 1sin 5221 −Θ+Θ−=Θ − DDEtDD ЛИТЕРАТУРА 1. Айзекс Р. Дифференциальные игры. –– М.: Мир, 1967. –– 479 c. 2. Понтрягин Л.С. Избранные научные труды. Т. 2. Дифференциальные уравнения. Теория операторов. Оптимальное управление. Дифференциальные игры. –– М.: Наука. 1988. –– 576 с. 3. Красовский Н.Н., Субботин А.И. Позиционные дифференциальные игры. –– М.: Наука, 1974. –– 456 с. Линейные дифференциальные игры с разнотипными интегральными ограничениями Системні дослідження та інформаційні технології, 2002, 1 153 4. Пшеничный Б.Н., Остапенко В.В. Дифференциальные игры. – Киев: Наук. думка, 1992. –– 264 с. 5. Чикрий А.А. Конфликтно управляемые процессы. – Киев: Наук. думка. –– 1992. –– 382 с. 6. Никольский М.С. Прямой метод в линейных дифференциальных играх с интегральными ограничениями // Управляемые системы. Изд-во СО АН СССР. –– 1969. –– Вып. 2. –– С. 53–60. 7. Азимов А.Я. Об одном способе преследования в линейных дифференциальных играх с интегральными ограничениями // Изв. АН СССР. –– Сер. Техн. кибернетика. –– 1974. –– № 2. – С. 31–35. 8. Пшеничный Б.Н., Онопчук Ю.Н. Линейные дифференциальные игры с интегральными ограничениями // Изв. АН СССР. –– Сер. Техн. кибернетика. –– 1968. –– № 1. –– С. 13–22. 9. Онопчук Ю.Н. О дифференциальных играх с интегральными ограничениями // Тр. семинара «Теория оптимальных решений». –– Киев: ИК АН УССР, 1967. — № 2. –– С. 45–55. 10. Никольский М.С. Об одном классе дифференциальных игр // Тр. семинара «Теория оптимальных решений». — Киев: ИК АН УССР, 1968. –– № 2. –– С. 3-13. 11. Гусятников П.Б., Никольский М.С. К проблеме оптимальности времени преследования // Теория оптимальных решений. –– Киев: ИК АН УССР. ―1969. –– № 3. –– С.3–21. 12. Остапенко В.В., Рижкова І.Л. Про лінійну диференціальну гру з фіксованим часом закінчення та обмеженнями на ресурси // Кибернетика и системный анализ. ― 2000. ― №4. ― С.178–183. Поступила 10.10.2001

Линейные дифференциальные игры с разнотипными интегральными ограничениями

Репозитарії

Схожі ресурси