Об управлении финансовыми стратегиями на рынке ценных бумаг
It is investigated the task of financial strategies control on the financial market using the theory of Markov’s processes.
Gespeichert in:
Datum: | 2006 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2006
|
Schriftenreihe: | Теорія оптимальних рішень |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/84967 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Об управлении финансовыми стратегиями на рынке ценных бумаг / Т.А. Пепеляева // Теорія оптимальних рішень: Зб. наук. пр. — 2006. — № 5. — С. 154-161. — Бібліогр.: 6 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-84967 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-849672015-07-18T03:02:01Z Об управлении финансовыми стратегиями на рынке ценных бумаг Пепеляева, Т.А. It is investigated the task of financial strategies control on the financial market using the theory of Markov’s processes. 2006 Article Об управлении финансовыми стратегиями на рынке ценных бумаг / Т.А. Пепеляева // Теорія оптимальних рішень: Зб. наук. пр. — 2006. — № 5. — С. 154-161. — Бібліогр.: 6 назв. — рос. XXXX-0013 http://dspace.nbuv.gov.ua/handle/123456789/84967 519.21 ru Теорія оптимальних рішень Інститут кібернетики ім. В.М. Глушкова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
It is investigated the task of financial strategies control on the financial market using the theory of Markov’s processes. |
format |
Article |
author |
Пепеляева, Т.А. |
spellingShingle |
Пепеляева, Т.А. Об управлении финансовыми стратегиями на рынке ценных бумаг Теорія оптимальних рішень |
author_facet |
Пепеляева, Т.А. |
author_sort |
Пепеляева, Т.А. |
title |
Об управлении финансовыми стратегиями на рынке ценных бумаг |
title_short |
Об управлении финансовыми стратегиями на рынке ценных бумаг |
title_full |
Об управлении финансовыми стратегиями на рынке ценных бумаг |
title_fullStr |
Об управлении финансовыми стратегиями на рынке ценных бумаг |
title_full_unstemmed |
Об управлении финансовыми стратегиями на рынке ценных бумаг |
title_sort |
об управлении финансовыми стратегиями на рынке ценных бумаг |
publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
publishDate |
2006 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/84967 |
citation_txt |
Об управлении финансовыми стратегиями на рынке ценных бумаг / Т.А. Пепеляева // Теорія оптимальних рішень: Зб. наук. пр. — 2006. — № 5. — С. 154-161. — Бібліогр.: 6 назв. — рос. |
series |
Теорія оптимальних рішень |
work_keys_str_mv |
AT pepelâevata obupravleniifinansovymistrategiâminarynkecennyhbumag |
first_indexed |
2025-07-06T12:05:23Z |
last_indexed |
2025-07-06T12:05:23Z |
_version_ |
1836899131410350080 |
fulltext |
154 Теорія оптимальних рішень. 2006, № 5
ÒÅÎвß
ÎÏÒÈÌÀËÜÍÈÕ
вØÅÍÜ
Исследуется задача управления
торговыми стратегиями на фи-
нансовом рынке с помощью тео-
рии марковских процессов.
Т.В. Пепеляева, 2006
ÓÄÊ 519.21
Ò.Â. ÏÅÏÅËßÅÂÀ
ÎÁ ÓÏÐÀÂËÅÍÈÈ
ÔÈÍÀÍÑÎÂÛÌÈ ÑÒÐÀÒÅÃÈßÌÈ
ÍÀ ÐÛÍÊÅ ÖÅÍÍÛÕ ÁÓÌÀÃ
Введение. Каждый инвестор, который опери-
рует на рынке ценных бумаг, хочет получить
наибольший возможный доход при наличии
некоторого капитала за определенный период
времени. Поэтому из большого количества
разнообразных финансовых стратегий ему
необходимо выбрать оптимальную с этой
точки зрения.
В настоящей работе исследуется метод оп-
ределения оптимальной торговой стратегии с
помощью функции полезности. Этот метод
базируется на методах теории управления
марковскими процессами и принципе Белл-
мана.
В работе [1] исследованы случаи конечных
пространства состояний управляемой систе-
мы и пространства возможных торговых
стратегий на рынке ценных бумаг, из которой
следует выбирать оптимальную стратегию. А
также рассмотрен случай, когда эти про-
странства являются счетными или компакт-
ными. Доказаны соответствующие теоремы
существования оптимальных торговых стра-
тегий в этих случаях.
В настоящей работе продолжается иссле-
дование задачи управления торговыми стра-
тегиями на финансовом рынке.
Определения и обозначения, которые нам
понадобятся в настоящей работе подробно
изложены в [1]. Приведем основные из них.
Пусть (Ω, Φ, P) − вероятностное простран-
ство, где Ω − множество состояний финансо-
вой системы, и пусть также ∀t≥0
Φt⊂ Φ множество событий, которое соответ-
ствует информации, которая была получена
ОБ УПРАВЛЕНИИ ФИНАНСОВЫМИ СТРАТЕГИЯМИ НА РЫНКЕ ЦЕННЫХ БУМАГ
Теорія оптимальних рішень. 2006, № 5
155
к моменту времени t. Другими словами, если событие B∈ Φt, то в момент време-
ни t известно, является ли это событие истинным или ложным. Далее будем
предполагать, что Φt − неубывающий поток σ-алгебр, т. е. ∀t < s Φt⊂ Φs. В дан-
ной работе будем рассматривать так называемые адаптированные процессы, ко-
торыми называются последовательности вида X = {X0, X1,...}, такие, что ∀t ≥ 0 Xt
является Φt-измеримой случайной величиной.
Рынок ценных бумаг задается следующим образом. Рассмотрим ценную бу-
магу (требование к адаптированному процессу дивидендов δ), дивиденды δt, за-
плаченные по ценной бумаге в момент времени t. Каждой ценной бумаге соот-
ветствует адаптированный процесс цены S, а St − стоимость ценной бумаги (ко-
торую еще называют ex-дивидендом) в момент времени t. На рынке существует
N ценных бумаг, которые определяют R
N
-измеримый адаптированный процесс
δ = (δ1
,…,δN
)... Предположим также, что эти ценные бумаги имеют некоторые
процессы стоимостей (цен) S = (S
1
,…,S
N
). Торговой стратегией будем считать
адаптированный процесс θ∈R
N
, а процесс θt = (θ1
t ,... , θ
N
t) − портфель, получен-
ный после торговли в момент времени t. Дивидендный процесс δθ
определятся с
помощью торговой стратегии θ следующим образом:
δθ
t = θt-1(St+δt) − θtSt, где θ-1 = 0. (1)
Пусть Θ пространство торговых стратегий, и Θ ≡ L
N
, где L – это пространст-
во адаптированных процессов. Для агента, который оперирует на рынке ценных
бумаг, рассмотрим строго возрастающую функцию полезности U, определенную
на L+ (множестве неотрицательных адаптированных процессов потребления) и
процесс взноса e∈L+. При заданной паре (δ, S) торговая стратегия θ ставит в со-
ответствие агенту процесс (суммарного общего) потребление e + δθ
. Таким обра-
зом агент имеет множество возможных потреблений Х = {с = e + δθ∈L+: θ ∈Θ}.
Перед агентом стоит задача максимизации функции полезности, которая по-
казывает, насколько выгодной для инвестора является выбранная стратегия, т. е.
нужно найти решение задачи: sup
Xc∈
U(c).
1. Рассмотрим задачу выбора портфеля и стоимости ценных бумаг с помощью
динамического программирования, т. е. метода решения задачи динамиче-
ской оптимизации с помощью рекурсивных структур. Этот метод базируется
на принципе оптимальности Беллмана и на теории марковских цепей, основ-
ные положения которых изложены далее.
Пусть процесс накопления капитала агента при процессе потребления с обо-
значается Wc и определяется следующим образом:
c
W0 = 0,
t
tt
c
tc
t
d
ceW
W 111 −−− −+
= , t≥1, (2)
Т.В. ПЕПЕЛЯЕВА
Теорія оптимальних рішень. 2006, № 5
156
где Wt − накопленный капитал в момент времени t; et − взнос в момент времени
t; ct − потребление в момент времени t; dt > 0 − дисконт в момент времени t.
Тогда задачу агента, при заданной функции полезности U:L+ →R на множе-
стве неотрицательных адаптированных процессов L+ , можно записать следую-
щим образом: sup
c
U(c), уравнение (2), с ≤ c
TW + e.
Заметим, что динамическое программирование удобно применять со специ-
альными типами функций полезности. Одним из простейших таких примеров
есть адитивна функция полезности U, которая определяется следующим образом:
U(с)=E [∑
=
T
t 0
ut(ct)],
где ut:R+ →R − строго возрастающая и непрерывная по t функция, Т − фиксиро-
ванный момент платежа.
Для простоты исследования этого примера будем считать, что Φt={Ω, ∅},
t≥0. И, пусть текущий капитал c
tW = w. Тогда максимизация полезности в мо-
мент времени t при каждом w∈R будет
Vt(w) = sup
+∈Lc
Е∑
=
T
ts
us(cs),
при условиях c
tW = w , уравнение (2), с ≤ c
TW + e.
При t = T функция Vt будет иметь вид VT(w) = u(w + e), w≥ − e, а для t < T ,
как показано в [2],
Vt(w) = sup
+∈Rc
Е ut(c ) + Vt+1
−+
t
t
d
cew
. (3)
Соотношение (3) называют уравнением Беллмана. Оптимальная политика
потребления с определяется индуктивно следующим образом: ([2]) ct = Ct (
c
tW ),
где Ct (w) − решение уравнения (3) для t < T и CT (w) = w + e. Из уравнения Белл-
мана (3) вытекает, что функция стоимости Vt+1 содержит всю необходимую ин-
формацию о будущем для принятия решения в момент времени t.
Для некоторых функций полезности рассмотрим задачу управления финан-
совой стратегией на рынке ценных бумаг с помощью теории управления цепями
Маркова. Основные понятия и положения этой теории подробно изложены в [1].
Напомним, что управление θ называется марковским, если ∀t ≥ 0 θt в дейст-
вительности зависит только от последнего аргумента θt = θt (zt), т. е. для любых
значений z′0, z′1,..., z′t-1 и z′′0, z′′1,..., z′′t-1: θt(z′0, z′1,..., z′t-1, zt)=θt (z′′0, z′′1,..., z′′ t-1, zt).
Управление θ называется однородным марковским, если )()(
21
zz tt θ≡θ , t1, t2 > 0.
Пусть ∆ − совокупность всех управлений θ. Обозначим Θt(z), t ≥ 0 некото-
рые фиксированные подмножества (разные для различных значений Xt = z) про-
ОБ УПРАВЛЕНИИ ФИНАНСОВЫМИ СТРАТЕГИЯМИ НА РЫНКЕ ЦЕННЫХ БУМАГ
Теорія оптимальних рішень. 2006, № 5
157
странства Θ, каждое из которых ограничивает область значений управления θt в
момент времени t, если Xt = z. Управление θ∈∆ называется допустимым, если
∀t ≥ 0 : θt (Х0,... , Xt−1, z)∈ Θt(z) ⊆ Θ.
Класс допустимых управлений обозначим ∆′ . Очевидно, что выделение
класса ∆′ , который характеризуется набором {Θt(z), t ≥ 0}, зависит от сути кон-
кретной задачи. Обозначим ∆ ′′ класс тех допустимых управлений, для которых
∀t ≥ 0 : Θt(z) ≡ Θ(z) ( ⊆ Θ).
Рассмотрим на рынке ценных бумаг марковский процесс состояний Х = {X0,
X1,... } такой, как вышеописан. Пусть L − пространство последовательностей
случайных величин вида c = {c0, c1, c2,…} и, таких, что ∀t ≥ 0 сt есть
Φt-измеримой, и существует константа k, такая, что сt≤ k. Другими словами, L
− это пространство ограниченных адаптированных процессов. Агент выбирает
процесс потребления из множества L+ неотрицательных процессов из L.
Пусть на рынке существует N ценных бумаг, причем n-я ценная бумага оп-
ределяется процессом дивидендов δn
из L, и ему соответствует процесс цены S
n
из L. Торговой стратегией агента считаем θ = (θ1
,... ,θN
), который принадлежит
множеству Θ ≡ L
N
. Каждая стратегия θ∈Θ определяет дивидендный процесс δθ
из L соотношением (1).
Будем считать, что процесс Х зависит от торговой стратегии θ, т. е. (Х, θ) −
управляемая цепь.
Агенту, который оперирует на рынке ценных бумаг, поставим в соответст-
вие процесс вклада е∈L+ и при заданном начальном состоянии и функцию по-
лезности U
i
: L+ →R, которая характеризует доход агента от выбранной стратегии
θ и, таким образом, дает возможность судить о качестве того или иного управ-
ления. Таким образом перед агентом стоит задача
sup
)(eΘ∈θ
U
i
(e + δθ
), где Θ(e) = {θ ∈Θ: e +δθ
≥ 0}.
Для любого t Φt − множество событий, порожденное {X0, ... , Xt}, т. е. ин-
формация, доступная в момент времени t, полученная наблюдением процесса
состояний X к моменту времени t.
2. Далее будем считать однородными по времени функцию полезности, про-
цесс взноса и процесс дивидендов.
При заданном начальном состоянии i рассмотрим функцию полезности
U
i
: L+ →R, которую определяют величина переоценки ρ∈(0, 1) и строго воз-
растающая, ограниченная, вогнутая и непрерывная функция u: R+ →R, такая, что
Ui(с) = Ei [∑
∞
=0t
ρt
u(ct)],
где Ei − математическое ожидание по вероятностной мере Pi, согласованное с
начальным состоянием X0 = i.
Рассмотрим другую функцию полезности, которая определяет для стратегии
θ средний доход в единицу времени
Т.В. ПЕПЕЛЯЕВА
Теорія оптимальних рішень. 2006, № 5
158
)(1 cU
i
=
∞→T
lim inf
T
1
∑
=
T
0t
Ei u(ct).
Пусть функции g: Z → R++, f: Z → N
R ++ , такие, что ∀t вклад et = g(Xt) и диви-
денды δt = f(Xt). Предположим, что стоимость ценной бумаги заданна некоторой
функцией S: Z→ N
R ++ таким образом: ∀t: St = S(Xt).
Зафиксируем портфель b∈ N
R ++ , пусть − b − нижняя граница короткой пози-
ции, капитал ограничен снизу величиной w =
Zi∈
min − b[S(i) + f(i)].
Обозначим D = Z × [ w , ∞ ). Будем считать, что функция F: D→R относит-
ся к пространству, которое обозначим B(D), если ∀i ∈Z F(i, · ): [ w , ∞ )→R яв-
ляется ограниченной, непрерывной и вогнутой функцией.
Для функции )(cU
i определим функцию V∈B(D), такую, что
V(i,w) =
θ×∈θ +L)(c,
sup )(cU
i , (4)
и выполнены условия
θ
0W = w, (5)
θ
tW = θt-1[S(Xt) + f(Xt)], t ≥ 1, (6)
ct + θt S(Xt) ≤ θ
tW + g(Xt), t≥0, (7)
θt ≥ − b, t ≥ 0. (8)
Управление θ
~
∈∆′ называется оптимальным по U-критерию, если ∀и∈ Z :
V(i, w) = )
~
,( θeU
i .
В работе [2] рассмотрена задача нахождения оптимизации в случае, когда
процесс состояний {Xt, t ≥ 0} − марковская (не управляемая) цепь, т. е. вероят-
ность перехода в другое состояние не зависит от выбора стратегии.
В настоящей работе исследуются управляемые цепи Маркова, определения
которого даны выше. Следовательно пусть далее пара (Х, θ) определяет управ-
ляемую цепь Маркова.
Будем искать функцию V∈B(D) как стоимость задачи управления, которая
удовлетворяет условие (4) и подчиненная условиям (5) − (8). Метод нахождения
функции V, предложенный в [2], состоит в следующем. Возьмем любую функ-
цию F из B(D) и с помощью ее построим новую функцию ΥF.
Следовательно пусть для некоторой функции F∈B(D) определим ΥF:D→R
таким образом:
ΥF(i,w) =
NRR),c(
sup
×∈θ +
ρu )c( + ρEi[F(X2, θ [S(X2) + f(X2)])], (9)
c + θ S(i) ≤ w + g(i), (10)
ОБ УПРАВЛЕНИИ ФИНАНСОВЫМИ СТРАТЕГИЯМИ НА РЫНКЕ ЦЕННЫХ БУМАГ
Теорія оптимальних рішень. 2006, № 5
159
θ ≥ − b. (11)
Иными словами, ΥF(i,w) является супремумом функции полезности, что
можно получить при определении начальных условий (i,w) в предположении,
что функция V в следующий период времени будет равна F.
Уравнение (9) с условиями (10), (11) − уравнением Беллмана.
Далее показано, что если F = ΥF, то F = V. Такой подход приводит к алго-
ритму нахождения V, что называется итерацией стоимости. Опишем этот метод
подробнее. Имеет место следующее утверждения из [2].
Лемма 1. Если F∈B(D), тогда и ΥF∈B(D).
Введем понятия расстояния между двумя функциями с B(D).
Пусть F, G∈B(D). Расстоянием между функциями F и G будем называть
d(F, G) = sup{F(i,w) − G(i, w): (i, w) ∈D}.
Разумеется, что F = G тогда и только тогда, когда d(F, G) = 0.
Лемма 2 [2]. Для любых F, G∈B(D) : d(ΥF, ΥG) ≤ ρ d(F, G).
Применив эту лемму, мы можем построить единственное решение F урав-
нение ΥF = F. Решение F называется неподвижной точкой Υ.
Следующее утверждение показывает, что F может быть построенное как
граница функций (путем итераций).
Лемма 3 [2]. Пусть F−1(i,w) = 0 для всех (i,w) с D и пусть Ft = Υ Ft−1, t ≥ 0.
Тогда F(i,w) ≡
∞→t
lim Ft(i,w) существует для всех (i,w) с D и определяет единым
образом функцию F с B(D), для которой выполненное F = Υ F.
Пусть С: D→R+, Ф: D→R
N
, и [С(i,w), Ф(i,w)] − решение уравнения (9) − (11).
Пусть также при заданных начальных условиях (i,w) в (4) − (8)
∗
0W = w,
∗
tW = Ф(Хt−1,
∗
1-tW ), t ≥ 1.
Дальше определим (c
*
, θ*
) таким образом:
∗
tc = С(Xt,
∗
tW ), ∗θt = Ф(Xt,
∗
tW ).
Пара (c
*
, θ*
) определяет оптимальную политику обратной связи.
Теорема 1. Пусть пространство состояний управляемой системы Z и про-
странство возможных торговых стратегий на рынке ценных бумаг Θ − конечные
множества, и 0 ≤ u(c) ≤ K < ∞ . Тогда функция V, что определена в (4) − (8), −
единая неподвижная точка Υ . Оптимальная политика обратной связи (c
*
, θ*
) −
решение (4) − (8).
Доказательство, такое, как доказательство аналогичного утверждения для
неуправляемых цепей с [2].
Рассмотрим задачу оптимизации торговой стратегии на финансовом рынке в
случае, когда фазовое пространство управляемой системы и пространство выбо-
ра допустимых стратегий являются компактными или счетными множествами.
Утверждения и определения, которые нам понадобятся для дальнейшего из-
ложения, подробно изложены в [1].
Т.В. ПЕПЕЛЯЕВА
Теорія оптимальних рішень. 2006, № 5
160
Применим теперь известные результаты, полученные в [3, 4] к рынку цен-
ных бумаг, и получим следующие теоремы о достаточных условиях
U-оптимальной торговой стратегии.
Теорема 2. Пусть на рынке ценных бумаг пространство возможных торго-
вых стратегий Θ − конечно. Тогда ∀ρ∈(0,1) в Θ0 существует оптимальная по
U-критерию стратегия θρ и оптимальный доход Uρ = Uρ(c, θρ) − единственное в
M(Z) решение уравнения
U(z) = { }∫ θρ+θ
Θ∈θ
),/()(),(max zdyPyUzu . (12)
Теорема 3. Пусть на рынке ценных бумаг пространство возможных торго-
вых стратегий Θ − компактно и
1) функция u(z, θ) полунепреравная сверху на Z × Θ;
2) переходная вероятность P(⋅ / z, θ ) слабо непрерывна по z, θ .
Тогда ∀ρ∈(0,1) в Θ0 существует оптимальная по U-критерию стратегия θρ и
оптимальный доход Uρ= Uρ(c, θρ) − единственное в C1(Z) решение уравнения (12).
Для того, чтобы сформулировать следующие теоремы о существовании оп-
тимальной по U1-критерию стратегии, введем следующую функцию:
vρ(z) = Uρ(z) − Uρ(с),
где с − некоторая фиксированная точка пространства Z.
Для vρ(z) выполнено соотношение
gρ + vρ(z) = { }∫ θρ+θ ρ
Θ∈θ
),/()(),(max zdyPyvzu ,
где gρ = (1− ρ) Uρ(z).
Пусть также выполненное предположение:
*) существуют последовательность {ρn}↑1 , точка z∈Z и число N < ∞ такие,
что
)(zv
nρ < N, z∈Z, n = 1,2,…
Теперь мы можем сформулировать следующее утверждение.
Теорема 4. Пусть на рынке ценных бумаг пространство состояний управ-
ляемой системы Z − компакт, и пространство возможных торговых стратегий
Θ − конечное множество, и выполненное предположение *) и
1) функция u(z, θ) непрерывна по z ∀θ∈Θ;
2) θ( X/ z, z′, θ) → 0 при z′ → z ∀θ∈Θ, где θ ( ⋅ / z, z′, θ) − полная вариация
меры Q ( ⋅ / z , z′, θ) = P( ⋅ / z, θ ) − P(⋅ / z′, θ ).
Тогда в Θ0 существует оптимальная по U1-критерию торговая стратегия.
Теорема 5. Пусть на рынке ценных бумаг пространство состояний управ-
ляемой системы Z и пространство возможных торговых стратегий Θ − компак-
ты, выполнено предположение *) и такие условия:
1) функция u(z, θ) непрерывна по z, θ;
2) θ( X/ z, z′, θ)→0 при z′→z равномерно по θ∈Θ;
3) переходная вероятность P( ⋅ / z, θ ) слабо непрерывна по с, θ.
ОБ УПРАВЛЕНИИ ФИНАНСОВЫМИ СТРАТЕГИЯМИ НА РЫНКЕ ЦЕННЫХ БУМАГ
Теорія оптимальних рішень. 2006, № 5
161
Тогда в Θ0 существует оптимальная по U1-критерию торговая стратегия.
Доказательство теорем 4, 5 аналогично доказательству соответствующих
теорем из [4].
Заключение. Полученные результаты показывают, что оптимальные торго-
вые стратегии на рынке ценных бумаг можно находить с помощью теории
управляемых цепей Маркова. К задаче финансовой математики выбора портфе-
ля и цен ценных бумаг может быть применен метод динамического программи-
рования. На основании известных результатов теории управления были найдены
условия существования оптимальной стратегии на финансовом рынке в классе
однородных цепей Маркова.
Т.В. Пепеляєва
ПРО КЕРУВАННЯ ФІНАНСОВИМИ СТРАТЕГІЯМИ НА РИНКУ ЦІННИХ ПАПЕРІВ
Досліджується задача керування торговими стратегіями на фінансовому ринку за допомогою
теорії марківських процесів.
T.V. Pepelyaeva
ABOUT THE FINANCIAL STRATAGIES CONTROL ON THE SECURITIES MARKET
It is investigated the task of financial strategies control on the financial market using the theory of
Markov’s processes.
3. Пепеляева Т.В. Об оптимальных торговых стратегиях на финансовом рынке // Тео-
рія оп тимальних рішень. – 2005. – № 4 . – С. 56–65.
4. Duffie D. Dynamic Asset Priciny Theory – Princeton University Press, 1992. – 299 p.
5. Blackwell D. Discounted dynamic programming // Ann. Math. Statist.– 1965.– 36, N 1. –
P. 15–35.
6. Maitra A. Discounted dynamic programming on compact metric spaces // Sankhya. Ser. A.
– 1968. – 30, N 2. – P. 20–36.
Получено 10.07.2006
|