Исследование информационных процессов в некоторых повторяющихся играх

Рассматривается неантагонистическая повторяющаяся игра с непрерывным временем. Один раз за всю игру может подействовать возмущающий фактор. Он изменяет существующую ситуацию равновесия на другую. При этом выигрыш второго игрока уменьшается. Найдены равновесные стратегии и оптимальный дискретный режи...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2010
1. Verfasser: Мохонько, Е.З.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2010
Schriftenreihe:Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/18623
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Исследование информационных процессов в некоторых повторяющихся играх / Е.З. Мохонько // Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки: зб. наук. пр. — Кам’янець-Подільський: Кам'янець-Подільськ. нац. ун-т, 2010. — Вип. 3. — С. 132-142. — Бібліогр.: 5 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-18623
record_format dspace
spelling irk-123456789-186232011-04-07T12:04:45Z Исследование информационных процессов в некоторых повторяющихся играх Мохонько, Е.З. Рассматривается неантагонистическая повторяющаяся игра с непрерывным временем. Один раз за всю игру может подействовать возмущающий фактор. Он изменяет существующую ситуацию равновесия на другую. При этом выигрыш второго игрока уменьшается. Найдены равновесные стратегии и оптимальный дискретный режим получения информации. Показано, что наблюдатель оценивает режим получения информации как оптимальный или избыточный в зависимости от модели реальности, которой он пользуется. The non-antagonistic repeated game are considered. The disturbance is able to act once the game. It changes the existing situation of equilibrium for another one. For this the second player gain decreases. The equilibrium strategies and the optimum discrete regime of the information receipt are found. It is shown that observer estimates the regime of the information receipt as the optimum or surplus regime depending on the model of reality which is used by him. 2010 Article Исследование информационных процессов в некоторых повторяющихся играх / Е.З. Мохонько // Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки: зб. наук. пр. — Кам’янець-Подільський: Кам'янець-Подільськ. нац. ун-т, 2010. — Вип. 3. — С. 132-142. — Бібліогр.: 5 назв. — рос. XXXX-0059 http://dspace.nbuv.gov.ua/handle/123456789/18623 518.9 ru Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
description Рассматривается неантагонистическая повторяющаяся игра с непрерывным временем. Один раз за всю игру может подействовать возмущающий фактор. Он изменяет существующую ситуацию равновесия на другую. При этом выигрыш второго игрока уменьшается. Найдены равновесные стратегии и оптимальный дискретный режим получения информации. Показано, что наблюдатель оценивает режим получения информации как оптимальный или избыточный в зависимости от модели реальности, которой он пользуется.
format Article
author Мохонько, Е.З.
spellingShingle Мохонько, Е.З.
Исследование информационных процессов в некоторых повторяющихся играх
Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки
author_facet Мохонько, Е.З.
author_sort Мохонько, Е.З.
title Исследование информационных процессов в некоторых повторяющихся играх
title_short Исследование информационных процессов в некоторых повторяющихся играх
title_full Исследование информационных процессов в некоторых повторяющихся играх
title_fullStr Исследование информационных процессов в некоторых повторяющихся играх
title_full_unstemmed Исследование информационных процессов в некоторых повторяющихся играх
title_sort исследование информационных процессов в некоторых повторяющихся играх
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2010
url http://dspace.nbuv.gov.ua/handle/123456789/18623
citation_txt Исследование информационных процессов в некоторых повторяющихся играх / Е.З. Мохонько // Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки: зб. наук. пр. — Кам’янець-Подільський: Кам'янець-Подільськ. нац. ун-т, 2010. — Вип. 3. — С. 132-142. — Бібліогр.: 5 назв. — рос.
series Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки
work_keys_str_mv AT mohonʹkoez issledovanieinformacionnyhprocessovvnekotoryhpovtorâûŝihsâigrah
first_indexed 2025-07-02T19:35:22Z
last_indexed 2025-07-02T19:35:22Z
_version_ 1836565054093262848
fulltext Математичне та комп’ютерне моделювання 132 © Е. З. Мохонько, 2010 УДК 518.9 Е. З. Мохонько, д-р физ.-мат. наук Вычислительный центр им. А. А. Дородницына РАН, г. Москва ИССЛЕДОВАНИЕ ИНФОРМАЦИОННЫХ ПРОЦЕССОВ В НЕКОТОРЫХ ПОВТОРЯЮЩИХСЯ ИГРАХ Рассматривается неантагонистическая повторяющаяся иг- ра с непрерывным временем. Один раз за всю игру может по- действовать возмущающий фактор. Он изменяет существую- щую ситуацию равновесия на другую. При этом выигрыш второго игрока уменьшается. Найдены равновесные стратегии и оптимальный дискретный режим получения информации. Показано, что наблюдатель оценивает режим получения ин- формации как оптимальный или избыточный в зависимости от модели реальности, которой он пользуется. Ключевые слова: динамические игры, возмущающий фактор, оптимальный режим получения информации, избы- ток информации. В динамических играх часто используются стратегии, требующие непрерывного получения информации. В работах [1], [2], [3], [4] про- демонстрирована возможность замены таких стратегии стратегиями, требующими получение информации в отдельные моменты времени. При этом выигрыши игроков не изменяются и найденные режимы по- лучения информации в каком-то смысле оптимальны. Оптимальное получение информации важно как в случае, когда информации много и она легкодоступна, так и тогда, когда она дорогостоящая, и ее мало. Вопросы оптимального получения информации интересуют не только узких специалистов, но и широкую общественность, например, поль- зователей Интернета. В то же время избыточное получение информа- ции широко распространено. Здравый смысл подсказывает, что избы- точное получение информации может быть полезно, если резко меня- ются внешние условия, на фоне которых протекает конфликт. В [5] рассмотрена игра, в которой изменение внешних условий моделируется воздействием возмущения, которое меняет выигрыш второго игрока. Первые игрок может получать информацию и о воз- мущении и о выборах второго игрока непрерывно и дискретно. Пока- зано, что если разрешить первому игроку получать информацию о действиях второго игрока не оптимальным способом, а только близко к оптимальному способу, то можно существенно уменьшить необхо- димое количество моментов получения информации о том, подейст- вовало ли возмущение или нет. Серія: Фізико-математичні науки. Випуск 3 133 Цель данной статьи – показать, что наблюдатель реального про- цесса получения информации в конфликтной ситуации отнесет его к оптимальному или к избыточному, в зависимости от степени подроб- ности модели реального конфликта, которую он использует. Рассмотренная в данной работе игра является развитием игр из [1], [2]. Кононенко А.Ф. рассмотрел непрерывную неантагонистическую игру с фиксированным временем окончания. Игроки находятся на одном уровне иерархии. В этой игре были определены условия, при которых существует ситуация равновесия при непрерывном получе- нии информации и использовании стратегий с памятью. Он также рассмотрел усложненную игру, в которой игроки могут получать ин- формацию не только непрерывным, но и дискретным способом. Были найдены оптимальные дискретные режимы получения информации о действиях партнера. При этом сохраняется ситуация равновесия, су- ществующая при непрерывном наблюдении. Найденные режимы по- лучения информации оптимальны в том смысле, что для любых двух следующих друг за другом моментов получения информации рас- стояние между ними наибольшее. Если при фиксированном преды- дущем моменте получения информации попытаться увеличить рас- стояние до последующего момента получения информации, то ситуа- ция равновесия нарушится. В данной работе рассмотрен усложненный вариант этой игры. В ней один раз за всю игру может подействовать возмущение, не завися- щее от игроков. Оно меняет ситуацию равновесия, существующую в игре, на другую. При этом выигрыш второго игрока уменьшается. Для простоты считается, что второй игрок получает всю информацию только непрерывным образом. В рассмотренной игре первый игрок может по- лучать информацию о действиях второго игрока как дискретным, так и непрерывным способом. А информацию о том, подействовало ли воз- мущение или нет, он получает непрерывно. Найдены оптимальные ре- жимы получения информации о действиях второго игрока в этой игре. Они зависят от момента воздействия возмущения. Если возмущение не подействовало, то режим получения информации такой же, как если бы оно подействовало в конце игры. Оказалось, что если возмущение не подействовало, то ожидание его приводит к необходимости получения информации о действиях второго игрока чаще, чем в игре, в которой даже не предполагалось возможность действия возмущения. Частота получения информации также зависит от того, насколько уменьшается выигрыш второго игрока вследствие действия возмущения. Напомним о работах [1, 2] А.Ф. Кононенко. Рассматривается игра двух лиц с непрерывным временем, протекающая на отрезке [0, 1]. Математичне та комп’ютерне моделювання 134 Множества выборов , 1,2t i iX = игроков описываются измеримыми функциями ( )i tx , iix X∈ , iX – замкнутое ограниченное множество. Функции выигрыша игроков определяются равенствами ( )( ) 1 0 i i x t dtF M= ∫ . Здесь ( ) 1 21 2,x Xx x X X= ∈ = × , функции , 1, 2i iM = непрерывны. Рассматривается класс стратегий с памятью ( )( )., , , 0i i i t t tx xφ′ = > , где ( ) ( ){ }1 2 , 2 , ., ,0 , 1 i i iix t tx x xix τ τ=⎧= = ≤ <⎨ =⎩ . По определению при 0t = ii xφ = . Содержательно эти стратегии означают, что в любой момент времени t игрок знает о поведении партнера на интервале [ )0, t . Обозначение: ( ) ( ) ( )( ) ( )( )( ) 1 2 11 2 1 2 0 , ., , , ., ,i i i t t t t dtx xF F Mϕ ϕ ϕ ϕ ϕ= = ∫ . Стратегии ( )0 0 0 1 2,φ φ φ= образуют ситуацию равновесия, если ( ) ( )0 0 1 1 1 2,F Fφ φ φ≥ , ( ) ( )0 0 2 2 1 2,F Fφ φ φ≥ , , 1, 2i iφ∀ = . Пусть множество ( )1 2, , 1,2maxmin i i i i iD x X ix xM M L xx ⎧ ⎫⎪ ⎪= ∈ > = =⎨ ⎬ ⎪ ⎪⎩ ⎭ не пусто, тогда стратегии вида ( )( ) ( ) ( ) ( ) 0 0 0 0 1 2 , ., , ., , , , ., ,maxmin i i i i i i n i iii i tx x x t tx Arg tx x x x xM x x φ ⎧ ≡⎪= ⎨ ∈ ≠ ⎪⎩ где ( ) ( ) ( ) ( )1 1 2 0 0 0 1 2 1 2 2 1 2 , , 2 , , , , , 1 i ix xM Dx x x x xM ix xM =⎧⎪= = ∈⎨ =⎪⎩ образуют ситуа- цию равновесия. При использовании стратегий ( )( )., ,i i i t tx xφ′ = игрок получает информацию непрерывно. Оказывается такое непрерывное получение информации не нужно. Можно получать информацию в отдельные Серія: Фізико-математичні науки. Випуск 3 135 моменты времени. Если существует ситуация равновесия на классе стратегий ( ) ( )( )., ,i i it t tx xφ′ = и реализуется траектория ( ) 0x t Dx≡ ∈ , то существует ситуация равновесия на классе стратегий ( )( )., ,i i i ki tx x tφ′ = , 1 10 ... ... 1, 1, 2,...,i i i k k kt t t +< < < < ≤ = где ( ) ( ){ }., ,0i i i k kxx t tτ τ= ≤ < , 1 2 , 1 , , 2 ki k k it t it ⎧ =⎪= ⎨ =⎪⎩ и реализуется та же самая траектория ( ) 0x t Dx≡ ∈ . Равновесными, в частности, являются следующие стратегии: ( )( ) ( ) ( ) ( ) 0 0 0 0 1 2 , ., , ., , , , ., .maxmin i i i i i i k i i n i i iiki i k x x t x tx t Argx x x x t xM x x φ ⎧ ≡ ⎪= ⎨ ∈ ≠⎪ ⎩ Моменты времени i kt определены так: ( ) ( ) ( ) ( ) 0 10 0 2 , 2 1 , , , 1 k i ii k iq xi q qqt x iq x ⎧ =⎪= − = = ⎨ =⎪⎩ ( ) * 0 0 * , 1,2i i i i i M M iq x M L − = = − , ( )00 ,i i xM M= ( ) ( ) 1 0 0* 1 1 1 2, ,maxx x xM M x = ( ) ( ) 2 0 0* 2 2 21,maxx x xM M x = . Поясним эти формулы. Момент времени первого наблюдения, например, первого игрока за вторым, определяется по формуле ( )1 1 0 2 21 1 21t tM L M∗ + − = . Смысл равенства заключается в том, что до момента 1 1t второй игрок, отклонившись от намеченного решения, будет наказан первым игроком после этого момента времени. Тогда левая часть равенства определяет максимально возможный выигрыш второго игрока в слу- чае отклонения, а правая – планируемый выигрыш, если он не будет отклоняться. Отсюда получаем 1 1 21 qt = − . Аналогично для следующего момента времени наблюдения име- ем ( ) ( ) ( )1 1 1 10 2 22 1 2 2 11 1t t t tM L M∗ − + − = − . Отсюда ( )21 2 21 qt = − . Продолжая процесс, придем к формуле ( )1 21 k k qt = − . Рассматриваемая в настоящей работе игра являются более слож- ным вариантом игр из [1], [2]. Это повторяющаяся неантагонистиче- Математичне та комп’ютерне моделювання 136 ская игра двух лиц с непрерывным временем, в которой один раз за всю игру действует возмущающий фактор. Это изменяет оптималь- ный выбор второго игрока в случае, если он не отклонялся от опти- мального выбора до момента воздействия возмущения. Возмущаю- щее воздействие приводит к уменьшению выигрыша второго игрока. Итак, рассмотрим игру двух лиц с непрерывным временем, про- истекающую на отрезке [0, 1]. Множество выборов игроков , 1, 2,t i iX = описывается функциями вида ( ) )1 1 1 2 1 , 0, ( ) , [0,1], , ,1 i i i i i i i tx t t tx x x tx θ θ ⎧ ⎡∈⎪ ⎣= ∈ = ⎨ ⎡ ⎤∈⎪ ⎣ ⎦⎩ , ) ) 1 1 2 1 2 3 2 , 0, ( ) , , , ,1 i i i i i i i i tx t tx x tx θ θ θ θ ⎧ ⎡∈ ⎣⎪⎪ ⎡= ∈⎨ ⎣ ⎪ ⎡ ⎤∈⎪ ⎣ ⎦⎩ , ( ) ) ) ) 1 1 2 1 2 3 2 3 4 3 , 0, , , , , , , ,1 i i i i i i i i i i i x x tx x x θ θ θ θ θ θ ⎧ ⎡⎣⎪ ⎡⎪⎪ ⎣= ⎨ ⎡⎪ ⎣ ⎪ ⎡ ⎤⎪ ⎣ ⎦⎩ j iix X∈ , 1, 2,3.j = iX – замкнутые, ограниченные множества, 1 2 30 1i i iθ θ θ< < < < . Функции выигрыша игроков определяются равенствами ( )( ) 1 0 i i x t dtF M= ∫ , ( ) ( ) 1 21 2,x t Xx x X X= ∈ = × . Функции , 1, 2iM i = непрерывны. Рассмотрим класс стратегий ( ) ( )( )21 1 ., , ., ,t t txx αϕ=′ , ( ) ( )( )12 2 ., , ., ,x t t tx αϕ′ = , ( ) ( ){ }1 1., ,0t tx x τ τ= ≤ < , ( ) ( ){ }2 2., ,0t tx x τ τ= ≤ < , { }0,1α ∈ , ( ) ( ){ }., ,0t tα α τ τ= ≤ < , ( )0 0α = . По определению при 0t = положим ii xϕ = . Содержательно эти стратегии означают, что в любой момент времени t игрок знает о поведении партнера на [ )0, t , знает, подейст- вовала ли помеха или нет на [ )0, t , а также момент воздействия поме- хи. Если ( ) 0α τ = при [ )0, tτ ∈ , то помеха в этот период не подейст- вовала. Если ( ) 0α τ = при [ )0,τ ϑ∈ , ( ) 1α τ = при [ ), tτ ϑ∈ , то это значит, что в момент времени ϑ помеха подействовала. При опреде- Серія: Фізико-математичні науки. Випуск 3 137 ленных условиях, о которых будет сказано ниже, помеха изменяет выбор второго игрока независимо от его желания на значение 0 22x Xα ∈ . Игроки знают и эти условия, и это значение. Помеха дей- ствует один раз за всю игру. Обозначим ( ) ( ) ( ) ( )( ) ( ) ( )( )( ) 1 2 11 2 1 2 0 , ., , ., , ., , .,i i i t t t t dtx xF F Mϕ α αϕ ϕ ϕ ϕ= = ∫ . Стратегии ( )0 0 0 1 2,ϕ ϕ ϕ= образуют ситуацию равновесия, если ( ) ( )0 0 1 1 1 2,F Fϕ ϕ ϕ≥ , ( ) ( )0 0 2 2 1 2,F Fϕ ϕ ϕ≥ , , 1, 2i iϕ∀ = . Пусть множество ( )1 2, , 1,2maxmin i i i i i xx D x X ix xM M L ⎧ ⎫⎪ ⎪= ∈ > = =⎨ ⎬ ⎪ ⎪⎩ ⎭ не пусто, 0 0 1 2( , ) Dx x ∈ , 0 0 1 2( , ) Dx xα ∈ , ( )0 0 0 0 1 2 1 2( , ) ,x x x xα≠ . Условие действия помехи – она действует только в том случае, если до ее воздействия второй игрок не отклонялся от 0 2x . Если же он отклонялся, то помеха не изменяет его текущий выбор. Будем рассматривать случай 0 0 2 2M Mα < . При этом qqα > . * 0 2 2 * 2 2 M Mq M L α α − = − , * 0 2 2 * 2 2 M Mq M L − = − . Стратегии, описанные ниже, образуют ситуацию равновесия. Это такие стратегии: ( ) ( )( )0 21 ., , ., ,t t tx αϕ = ( ) ( ) ( ) ( ) [ ) ( ) [ ) ( ) 1 2 0 0 21 2 0 20 21 0 2 2 1 21 , ., , ., 0 , , ., 0, 0, , ., , , 1, , ,maxminн t tx x x txtx x t tx Argx x xM x x α α ϑ α τ τ ϑ ϑ α τ τ ϑ ⎧ = =⎪ ⎪ ⎧ < = ∈⎪ ⎪=⎨ ⎨ ≥ = ∈⎪⎪ ⎩ ⎪ ∈⎪ ⎩ , в противном случае ( ) ( )( ) ( )( ) ( ) [ ) ( ) [ ) ( ) ( ) ( ) 2 1 0 12 0 20 0 12 10 2 0 1 1 2 12 1 ., , ., , , ., 0, 0, ., , ,если ., , 1, , , , , .,maxminн x x t t tx t txt t tx x x t tx Arg tx x x x xM α αϕ α ϑ α α τ τ ϑ ϑ = ⎧ ⎧ = ∈⎪= =⎪ ⎨⎪ = ∈ ≥⎪⎩= ⎨ ⎪ ∈ ≠ ⎪⎩ . Докажем это утверждение. Математичне та комп’ютерне моделювання 138 Пусть 1ϑ – время начала отклонения игрока 2 от выбора 0 2x . Пусть 1ϑ меньше, чем время, когда подействовала помеха. Тогда ( ) ( )( ) ( ) ( )( ) 1 21 1 0 0 2 2 2 211 2 0 , ,max нx t dt t t dtx xF M M x ϑ ϑ ϕ ϕ ≤ + =∫ ∫ ( ) ( ) ( ) ( ) ( ) ( ) ( )00 0 0 0 2 2 2 2 2 21 1 1 11 1x x x xM L M M M F ϕϑ ϑ ϑ ϑ= + − ≤ + − = = . Пусть 1ϑ больше либо равно моменту, когда подействовала по- меха. Тогда ( ) ( )( ) ( ) 1 0 0 0 0 2 2 2 1 21 2 0 , ,x t dt dtx xF M M ϑ ϑ α ϑ ϕ ϕ ≤ + +∫ ∫ ( )2 11L ϑ− = ( ) ( )( ) ( )0 0 0 2 2 21 11 0, 1x x xM M Lαϑ ϑϑ ϑ= + − + − ≤ ( ) ( ) ( )00 0 0 2 2 21 2( , ) 1x x xM M Fαϑ ϑ ϕ≤ + − = . Аналогичные выкладки можно проделать для оценки ( )0 1 1 2,F ϕ ϕ . То есть, действительно, стратегии ( )0 0 1 2,ϕ ϕ образуют ситуацию равновесия. Сохраняется ситуация равновесия, существующая при непре- рывном наблюдении за партнером и возмущающим фактором, в слу- чае непрерывного получения информации о возмущающем факторе и дискретного режима получения информации о выборах второго иг- рока, если моменты получения информации специальным образом подобраны. Разделим [0, 1] точками *, 1, 2,...i iϑ = так: 0 22* 1 * 0 0 2 22 2 M L M M L M α αϑ − = − − + . Оно получилось из формул ( ) ( ) ( )0 * 0 0 2 22 2 21 1c ct tt tM M L M M αϑ ϑ+ − + − = + − , ( )0 0* 0 22 2 22 * * 2 2 2 2 1 c M M LM M tt M L M L αϑ ϑ+ − −− = + − − . Если до момента времени t второй игрок не отклонялся от на- меченной траектории, потом отклонился и стал максимизировать свой выигрыш, а в момент времени ct об этом отклонении узнал первый игрок и стал наказывать второго игрока до конца игры, то выигрыш второго игрока будет ( ) ( )0 * 2 22 1c ct tt tM M L+ − + − . Серія: Фізико-математичні науки. Випуск 3 139 Если же второй игрок не будет отклоняться, то он получит ( )0 0 2 2 1M M αϑ ϑ+ − . Для того, чтобы второму игроку было не выгодно отклоняться в момент времени t от договорной траектории, ct должно быть по- добрано так, чтобы эти два выражения были равны. Возьмем 0,t = получим 1t ... 0 0t = . Приравняем 1t ϑ= . По- скольку 0 0 2 2M M α> , то ( )ct ϑ непрерывно возрастает при росте ϑ . ϑ принадлежит отрезку [0, 1]. Если ϑ = 0, то 1t = .. 0 22 * 2 2 M L M L α − − . Если ϑ = 1, тогда 1t = 0 22 * 2 2 M L M L − − . 1 [0,1]t ∈ и существует такое *ϑ , при кото- ром * 1t ϑ= . Его и обозначим * 1ϑ . Если возмущение ϑ произойдет на * 1[0, ]ϑ , то первый игрок мо- жет применить формулу ( )0 0* 0 22 2 22 * * 2 2 2 2 1 c M M LM M tt M L M L αϑ ϑ+ − −− = + − − при 0t = и подсчитать ( )1t ϑ . При этом 1t будет максимально большим среди всех других первых моментов получения информации таких режимов, которые гарантируют сохранение ситуации равновесия, существующей при непрерывном наблюдении за выборами второго игрока. Это следует из метода вычисления ct . Если же * 1ϑ ϑ> , то первый игрок не может применить эту фор- мулу, и должен выбрать 1t , не зная реального момента воздействия возмущения. Если при этом он выберет 1t = * 1ϑ , то, во-первых, среди режимов гарантирующих сохранение ситуации равновесия, сущест- вующей при непрерывном наблюдение, есть режимы с таким 1t . Во вторых, такое 1t является максимально большим. Если же первый момент получения информации 1T больше * 1ϑ , тогда найдется мо- мент возмущения ϑ больше * 1ϑ , при котором все гарантирующие режимы имеют первые моменты получения информации меньше 1T . А нет гарантии, что именно в момент ϑ возмущение не подействует. Теперь рассмотрим второй момент 2t . В формулу ( )0 0* 0 22 2 22 * * 2 2 2 2 1 c M M LM M tt M L M L αϑ ϑ+ − −− = + − − подставим * 1ϑ и получим 2t . Математичне та комп’ютерне моделювання 140 Подставим вместо 2t момент ϑ и решим относительно ϑ . Получим значение для * 2ϑ . 00 * 2 22 2* 2 * 0 0 * 0 0 2 2 2 22 2 2 2 1 MM L M M M L M M M L M α α αϑ ⎛ ⎞− −⎜ ⎟= + ⎜ ⎟− − + − − +⎝ ⎠ . Аналогично получим ( )* 2 3 1b a aϑ = + + , где 0 22 * 0 0 2 22 2 M Lb M M L M α α − = − − + , 0* 2 2 * 0 0 2 22 2 1 MMa M M L M α − = < − − + . Аналогично ( )* 2 11 ... n n b a a aϑ −= + + + + . 2 1 *11 , 1 ... , (1 ) 1. 1 n n n n aa b a a a a a ϑ− − − = + + + + = = − < − 0n n a →∞ → , а моменты получения информации стремятся к 1. ( ) ( ) ( ) [ ) ( ) * * 1 1 0 0 22 2 1 2 2 , ., 0, [0, ], 1 , если ., 0, 0, , 1. t t M M L t M L t t α αϑ ϑ ϑ ϑ α ϑ α ϑ ∗ ⎧ ≡ ∈ ⎪ + − −⎪= ⎨ −⎪ ⎪ ≡ ∈ =⎩ Для k = 2, 3,… ( ) ( ) ( ) ) ( ) ( ) * * * 1 0 0 22 2 1 2 2 1 1 1 , ., 0, [ , ], 1 . если ., 0, , , 1 1 , 1 k k k k k k k k t t M M Lq M Lt t t q qt t α α α αϑ ϑ ϑ ϑ ϑ ϑ α ϑ α ϑϑ α − ∗ − ∗ ∗ − − − ⎧ ≡ ∈ ⎪ + − −⎪ +⎪ −= ⎨ ⎪ ⎡≡ ∈ =⎣⎪ ⎪ + − =⎩ Стратегии, описанные ниже, образуют ситуацию равновесия в данной игре с непрерывным получением информации об α и с воз- можностью для игрока 1 получать информацию о выборах второго игрока дискретным образом. Для описания этих стратегий сделаем такие обозначения. Если выполнены условия ( ) ( ) ( ) [ ) ( ) ( ) [ ) 0 2 2 0 2 , ., 0, 0,2., , , 1, ,2 k k xx tx x tx α α τ τ ϑτ α τ τ ϑτ ⎧ = ∈=⎪= ⎨ = ∈=⎪⎩ ( ) [ ) [ ] 0, 0, ., 1, , t t τ ϑ α τ ϑ ⎧ ∈⎪= ⎨ ∈⎪⎩ , то будем говорить, что выполнено условие A. Серія: Фізико-математичні науки. Випуск 3 141 ( ) ( )( ) ( ) ( ) ( ) 1 2 0 0 21 2 0 0 2 11 2 1 21 , ., , , ., 0, ., , ., , , если выполнено условие , ,maxmin k k k н tx x t x t t t Ax t x Argx x xM x x ϑ α αϕ ⎧ = < =⎪ ⎪= ⎨ ⎪ ∈ ⎪⎩ в противном случае ( ) ( )( ) ( )( ) ( ) [ ) ( ) [ ) ( ) ( ) ( ) 2 1 0 12 0 20 0 12 10 2 0 1 1 2 12 1 ., , ., , , ., 0, 0, ., , , если ., , 1, ,1 , , .,maxminн t t tx t txt t tx x x t tx Arg tx x x x xM x x α ϕ α α ϑ α α ϑ = ⎧ ⎧ = ∈⎪= =⎪ ⎨⎪ = ∈⎪⎩= ⎨ ⎪ ∈ ≠ ⎪⎩ . Если воздействие возмущения ожидалось, но оно не подействовало, то первый игрок будет получать информацию в моменты , 1, 2,...k kϑ∗ = . Во вто- рой игре, которую рассмотрел А. Ф. Кононенко, информация поступает в мо- менты ( )1 21 k k qt = − , где ( ) * 0 2 20 2 * 2 2 M Mq x M L − = − , 1, 2,...k = . При этом 1 k ktϑ∗ < . Наблюдатель, который оценивает, оптимально ли получение ин- формации в реальном конфликте, сделает свои выводы на основании той модели, которой он описывает конфликт. Он может сделать вы- вод, что получение информации избыточно, если не учитывает в сво- ей модели тревоги участников конфликта. То есть оценка, избыточен ли режим получения информации участников реального конфликта или же он оптимален, может зависеть от подробности модели, опи- сывающей реальную ситуацию. Наблюдателю, прежде, чем делать выводы, необходимо поинтересоваться, какой моделью реальности руководствуются те, кто получает информацию. Если есть лицо, заинтересованное в том, чтобы участники реаль- ного конфликта получали информацию как можно чаще, то это лицо должно всячески усиливать тревоги участников конфликта. И, наоборот, один из способов оптимизации режимов получения информации – это объяснение участникам конфликта, что те или иные их тревоги не соответствуют действительности. Таким образом, проведенное исследование углубило наше пони- мание явления избыточности и оптимальности режимов получения информации. Список использованной литературы: 1. Кононенко А. Ф. О задаче наблюдения в повторяющихся операциях / А. Ф. Кононенко // Современное состояние теории исследования опера- ций. – М. : Наука, 1976. – 464 c. – С. 179–182. Математичне та комп’ютерне моделювання 142 © А. А. Музичук, 2010 2. Кононенко А. Ф. Постановка задачи. Модель с непрерывным временем / А. Ф. Кононенко // Современное состояние теории исследования опера- ций. – М. : Наука, 1976. – 464 c. – С. 173–179. 3. Мохонько Е. З. Динамика информационных процессов в неантагонисти- ческих играх : дис. … докт. физ.-мат. наук / Е. З. Мохонько. – М. : ВЦ РАН, 1997. – 350 с. 4. Черноусько Ф. Л. Игровые задачи управления и поиска / Ф. Л. Черноусь- ко, А.А. Меликян. – М. : Наука, 1978. – 270 с. 5. Мохонько Е. З. Об информационных процессах в повторяющейся игре с возмущающим фактором / Е. З. Мохонько // Труды ИСА РАН, 2008. – Т. 39(1). – С. 88–98. The non-antagonistic repeated game are considered. The disturbance is able to act once the game. It changes the existing situation of equilibrium for another one. For this the second player gain decreases. The equilibrium strategies and the optimum discrete regime of the information receipt are found. It is shown that observer estimates the regime of the information re- ceipt as the optimum or surplus regime depending on the model of reality which is used by him. Key words: dynamic games, disturbance factor, optimum regime of in- formation receipt, redundancy of information. Отримано: 26.05.2010 УДК 519.8 А. А. Музичук, канд. фіз.-мат. наук Львівський національний університет імені Івана Франка, м. Львів УЗАГАЛЬНЕНА ОЦІНКА АЛЬТЕРНАТИВ В УМОВАХ ЙМОВІРНІСНОЇ ВИЗНАЧЕНОСТІ У роботі запропонований узагальнений критерій вибору найкращої альтернативи зі скінченної множини допустимих за умови відомого ймовірнісного розподілу станів зовнішнього середовища. За припущенням альтернативи описуються скін- ченним набором значень функцій результату. Запропонований критерій враховує відношення особи, що приймає рішення до ризику та рівень довіри до відомого апріорного розподілу. Ключові слова: прийняття оптимальних рішень, аналіз скінченних послідовностей, оцінка альтернатив, відношення до ризику. Вступ. Ситуація прийняття рішень, у якій альтернативи опису- ються скінченною кількістю значень функцій результату у визначені моменти часу, є типовою для більшості випадків аналізу “витрати –