Усреднение задачи оптимального управления на временных шкалах
Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах.
Gespeichert in:
Datum: | 2014 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут математики НАН України
2014
|
Schriftenreihe: | Нелінійні коливання |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/177096 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Усреднение задачи оптимального управления на временных шкалах / А.П. Огуленко, О.Д. Кичмаренко // Нелінійні коливання. — 2014. — Т. 17, № 3. — С. 365-378 — Бібліогр.: 18 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-177096 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1770962021-02-11T01:27:38Z Усреднение задачи оптимального управления на временных шкалах Огуленко, А.П. Кичмаренко, О.Д. Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах. We substantiate a numerical-asymptotic method for solving an optimal control problem on time scales. 2014 Article Усреднение задачи оптимального управления на временных шкалах / А.П. Огуленко, О.Д. Кичмаренко // Нелінійні коливання. — 2014. — Т. 17, № 3. — С. 365-378 — Бібліогр.: 18 назв. — рос. 1562-3076 http://dspace.nbuv.gov.ua/handle/123456789/177096 517.9 ru Нелінійні коливання Інститут математики НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
description |
Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах. |
format |
Article |
author |
Огуленко, А.П. Кичмаренко, О.Д. |
spellingShingle |
Огуленко, А.П. Кичмаренко, О.Д. Усреднение задачи оптимального управления на временных шкалах Нелінійні коливання |
author_facet |
Огуленко, А.П. Кичмаренко, О.Д. |
author_sort |
Огуленко, А.П. |
title |
Усреднение задачи оптимального управления на временных шкалах |
title_short |
Усреднение задачи оптимального управления на временных шкалах |
title_full |
Усреднение задачи оптимального управления на временных шкалах |
title_fullStr |
Усреднение задачи оптимального управления на временных шкалах |
title_full_unstemmed |
Усреднение задачи оптимального управления на временных шкалах |
title_sort |
усреднение задачи оптимального управления на временных шкалах |
publisher |
Інститут математики НАН України |
publishDate |
2014 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/177096 |
citation_txt |
Усреднение задачи оптимального управления на временных шкалах / А.П. Огуленко, О.Д. Кичмаренко // Нелінійні коливання. — 2014. — Т. 17, № 3. — С. 365-378 — Бібліогр.: 18 назв. — рос. |
series |
Нелінійні коливання |
work_keys_str_mv |
AT ogulenkoap usredneniezadačioptimalʹnogoupravleniânavremennyhškalah AT kičmarenkood usredneniezadačioptimalʹnogoupravleniânavremennyhškalah |
first_indexed |
2025-07-15T15:03:35Z |
last_indexed |
2025-07-15T15:03:35Z |
_version_ |
1837725716708327424 |
fulltext |
УДК 517.9
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ
НА ВРЕМЕННЫХ ШКАЛАХ
А. П. Огуленко, О. Д. Кичмаренко
Одес. нац. ун-т им. И. И. Мечникова
Украина, 65026, Одесса, ул. Дворянская, 2
We substantiate a numerical-asymptotic method for solving an optimal control problem on time scales.
Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування
системою на часових шкалах.
Введение. Выдающиеся результаты Н. М. Крылова и Н. Н. Боголюбова [1, 2] не толь-
ко заложили основу новых теоретических исследований, но и нашли свое применение в
различных отраслях прикладных наук. Н. Н. Моисеев [3] впервые применил метод усред-
нения к исследованию задач оптимального управления. В работах В. А. Плотникова и его
учеников метод усреднения применяется для новых классов задач управления системами
с запаздыванием, с разрывной правой частью и импульсами, с многозначной и нечеткой
правой частью, системами на дискретном времени и др. [4 – 13]. Такое разнообразие ма-
тематических моделей возникло из-за необходимости исследования сложных процессов,
существенно отличающихся своими особенностями.
С появлением работы S. Hilger [14] принципиально изменился подход к пониманию
природы времени в динамических системах. Понятие временной шкалы позволило по-
строить общую теорию динамических систем, описывающую и непрерывные системы,
и дискретные, и, что осoбенно важно, смешанные случаи. Подробное изложение теории
динамических систем на временных шкалах представлено в [15, 16].
Метод усреднения для динамической системы на временной шкале приведен в [17],
где рассматривается вопрос близости решения исходной системы на временной шкале и
решения усредненного обобщенного дифференциального уравнения.
Нами было получено обоснование схемы полного усреднения [18] (аналог теоремы
Боголюбова) при условии, что усредненная система имеет ту же природу, что и исходная,
причем обе динамические системы определены на одной и той же временной шкале.
Целью данной работы является построение метода усреднения для управляемых
систем на временных шкалах, установление алгоритма соответствия управлений исход-
ной и усредненной систем и, наконец, обоснование численно-асимптотического метода
решения задачи управления системой на временной шкале.
Вспомогательные сведения. Приведем основные сведения о временных шкалах, кото-
рые необходимы для изложения полученных результатов. Определения и понятия вводят-
ся и обозначаются в соответствии с [15, 16].
Под временной шкалой понимается непустое замкнутое подмножество множества ве-
щественных чисел, она обозначается символом T. Свойства временной шкалы определя-
ются тремя функциями:
c© А. П. Огуленко, О. Д. Кичмаренко, 2014
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 365
366 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
1) оператором перехода вперед:
σ(t) = inf {s ∈ T : s > t} ;
2) оператором перехода назад:
ρ(t) = sup {s ∈ T : s < t}
(при этом полагается inf ∅ = supT и sup∅ = inf T);
3) функцией зернистости
µ(t) = σ(t)− t.
Поведение операторов перехода вперед и назад в конкретной точке временной шка-
лы определяет тип этой точки. Соответствующая классификация точек временной шка-
лы представлена в таблице.
t справа рассеянная t < σ(t)
t справа плотная t = σ(t)
t слева рассеянная ρ(t) < t
t слева плотная ρ(t) = t
t изолированная ρ(t) < t < σ(t)
t плотная ρ(t) = t = σ(t)
Определим множество Tκ следующим образом:
Tκ =
T \ {M}, если существует справа рассеянная точка M ∈ T :
M = supT, supT < ∞,
T — в противном случае.
Далее полагаем [a, b] = {t ∈ T : a 6 t 6 b}.
Определение 1. δ-Разбиение отрезка временной шкалы [t0, tf ] определим следующим
образом: задавшись диаметром разбиения δ, положим первую точку разбиения равной
t0, а дальнейшие точки определим по формуле
ti =
sup (ti−1, ti−1 + δ], если ti−1 + δ ∈ Tκ,
σ(ti−1), если ti−1 + δ /∈ Tκ.
Замечание 1. Можно показать [16, c. 120], что построенное таким образом разбиение
имеет следующие свойства: для любого i либо ti − ti−1 ≤ δ (будем считать, что в этом
случае i ∈ Iδ), либо ti − ti−1 > δ и σ(ti−1) = ti (тогда i ∈ Iσ). Всюду далее полагаем
N = |Iδ| + |Iσ|, т. е. N — количество точек δ-разбиения. Кроме того, мы используем
обозначение I = Iδ ∪ Iσ для множества индексов всех точек δ-разбиения.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 367
Определение 2 [15]. Пусть f : T → R и t ∈ Tκ. Число f∆(t) называется ∆-производ-
ной функции f в точке t, если для любого ε > 0 найдется такая окрестность U точки
t (т. е. U = (t− δ, t+ δ) ∩ T, δ < 0), что
|f(σ(t))− f(s)− f∆(t)(σ(t)− s)| ≤ ε|σ(t)− s| ∀s ∈ U.
Определение 3 [15]. Если f∆(t) существует для любого t ∈ Tκ, то f : T → R на-
зывается ∆-дифференцируемой на Tκ. Функция f∆(t) : Tκ → R называется дельта-
производной функции f на Tκ.
Если f дифференцируема по t, то
f(σ(t)) = f(t) + µ(t)f∆(t).
Определение 4 [15]. Функция f : T → R называется регулярной, если во всех плот-
ных справа точках временной шкалы T она имеет конечные правосторонние пределы,
а во всех слева плотных точках — конечные левосторонние пределы.
Определение 5 [15]. Функция f : T → R называется rd-непрерывной, если в справа
плотных точках она непрерывна, а в слева плотных точках имеет конечные левосто-
ронние пределы. Множество таких функций обозначается Crd = Crd(T), а множество
дифференцируемых функций, производная которых rd-непрерывна, обозначается как
C1
rd = C1
rd(T).
Определение 6 [15]. Для любой регулярной функции f(t) существует функция F,
дифференцируемая в области D, такая, что для всех t ∈ D выполняется равенство
F∆(t) = f(t).
Эта функция называется предпервообразной для f(t) и определяется она неоднознач-
но.
Неопределенный интеграл на временной шкале имеет вид∫
f(t)∆t = F (t) + C,
где C — произвольная константа интегрирования, а F (t) — предпервообразная для f(t).
Далее, если для всех t ∈ Tκ выполняется F∆(t) = f(t), где f : T → R — rd-непрерывная
функция, то F (t) называется первообразной функции f(t). Если t0 ∈ T, то
F (t) =
t∫
t0
f(s)∆s
для всех t. Определенный ∆-интеграл для любых r, s ∈ T определяется так:
s∫
r
f(t)∆t = F (s)− F (r).
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
368 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
Определение 7 [15]. Пусть T — временная шкала и X — банахово пространство.
Функцию f : T×X → X будем называть:
1) rd-непрерывной, если функция g(t) = f(t, x(t)) rd-непрерывна для любой непрерыв-
ной функции x : T → X;
2) ограниченной в области Q ⊂ T ×X, если существует константа M > 0 такая,
что ‖f(t, x)‖ ≤ M для любой точки (t, x) ∈ Q;
3) липшицевой по x в области Q ⊂ T×X, если существует константа λ > 0 такая,
что
‖f(t, x1)− f(t, x2)‖ ≤ λ‖x1 − x2‖ ∀(t, x1), (t, x2) ∈ Q.
Определение 8 [15]. Функцию p : T → R будем называть регрессивной, если
1 +mu(t)p(t) 6= 0, t ∈ Tκ.
Множество регрессивных и rd-непрерывных функций обозначаетсяR = R(T).
Как показано в [15], функции p из классаR можно поставить в соответствие функцию
ep(t, s), которая по своим свойствам является аналогом экспоненты, определенной на R.
В дальнейшем понадобится также неравенство Гронуолла, которое мы сформулиру-
ем в виде следующей леммы.
Лемма 1 (неравенство Гронуолла, [15]). Пусть y — rd-непрерывная на T функция,
p ∈ R+, p ≥ 0, и α ∈ R. Если выполняется неравенство
y(t) ≤ α+
t∫
t0
y(τ)p(τ)∆τ, τ ∈ T,
то
y(t) ≤ αep(t, t0), τ ∈ T.
Основные результаты. Рассмотрим задачу оптимального управления системой на вре-
менной шкале
x∆(t) = ε[f(t, x(t)) +A(x(t))ϕ(t, u(t))],
(1)
x(t0) = x0,
с терминальным функционалом качества
min J [u] = Φ(x(t1)). (2)
Здесь T — временная шкала — непустое замкнутое подмножество из R, supT = +∞,
t ∈ T — время, x ∈ Rn, x∆ — ∆-производная, ε > 0 — малый параметр, f(t, x) — n-
мерная вектор-функция, A(x) — (n × m)-матрица, ϕ(t, u) — m-мерная вектор-функция,
Φ(·) : Rn → R, u(t) ∈ U — r-мерный вектор управления, U ∈ comp (Rr), t0 < inf T.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 369
Задаче (1), (2) поставим в соответствие усредненную задачу оптимального управле-
ния системой на той же временной шкале
ξ∆ = ε[f̄(ξ) +A(ξ)v],
(3)
ξ(t0) = x0,
с критерием качества
min J̄ [v] = Φ(ξ(t1)). (4)
Усреднение проводится следующим образом:
f̄(x) = lim
T→∞
T∈T
1
T
T∫
t0
f(t, x)∆t,
(5)
v ∈ V, V = co
lim
T→∞
T∈T
1
T
T∫
t0
ϕ(t, U)∆t
.
Последний интеграл в (5) понимается как аналог интеграла Аумана на временной шкале,
а сходимость соответствующего предела — в смысле метрики Хаусдорфа.
Рассмотрим теперь алгоритм, который позволяет установить соответствие между до-
пустимыми управлениями задач (1), (2) и (3), (4). Пусть сначала задано допустимое управ-
ление v(t) ∈ V усредненной задачи. Поставим ему в соответствие управление u(t) ∈ U
исходной задачи следующим образом:
1) зададимся некоторым δ-разбиением временной шкалы T, точки которого обозна-
чим ti;
2) вычислим точки vi =
1
ti+1 − ti
∫ ti+1
ti
v(s)∆s, i = 0, 1, 2, . . .;
3) построим управление u(t) = {ui(t), ti ≤ t < ti+1}, где ui(t) — решение задачи
минимизации нормы
∥∥∥∥ 1
ti+1 − ti
∫ ti+1
ti
ϕ(t, u(t))∆t− vi
∥∥∥∥ , т. е.
ui(t) = argmin
u(t)∈U
∥∥∥∥∥∥ 1
ti+1 − ti
ti+1∫
ti
ϕ(t, u(t))∆t− vi
∥∥∥∥∥∥ .
Замечание 2. Можно показать, что множество точек 1
ti+1 − ti
ti+1∫
ti
ϕ(t, u(t))∆t, u(t) ∈ U
является выпуклым компактом.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
370 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
Замечание 3. Управление ui(t), вообще говоря, находится неоднозначным образом.
Обратно, управлению u(t) ∈ U исходной задачи поставим в соответствие управление
v(t) ∈ V усредненной задачи следующим образом:
1) зафиксируем δ-разбиение T, определенное выше;
2) вычислим точки wi =
1
ti+1 − ti
∫ ti+1
ti
ϕ(t, ui(t))∆t, i = 0, 1, 2, . . .;
3) построим управление v(t) = {vi, ti ≤ t < ti+1}, где vi(t) находится из условия
vi = arg min
v∈V
‖wi − v‖.
Замечание 4. Управление vi, вообще говоря, находится неоднозначным образом.
Следующая теорема дает обоснование применения метода усреднения для уравнений
управляемого движения систем (1) и (3).
Теорема 1. Пусть в области Q = {t ∈ T, x ∈ D ⊂ Rn, u ∈ U ⊂ Rr} выполнены сле-
дующие условия:
1) функция f(t, x) rd-непрерывна по t, регрессивна и для нее выполнены условия су-
ществования и единственности решения задачи Коши, причем для любого (t, x) ∈ Q
‖f(t, x)‖ ≤ M, M > 0, f(t, x) липшицева по x с константой λ > 0;
2) функция A(x) удовлетворяет условию Липшица по x с постоянной λA и ограни-
чена константой M ;
3) функция ϕ(t, u) rd-непрерывна по t и непрерывна по u, ограничена константой M ;
4) для любых допустимых управлений v(t) решение ξ(t) усредненной системы (3) с
начальным условием ξ(t0) = x0 ∈ D′ ⊂ D вместе с ρ-окрестностью лежит в облас-
ти D;
5) существует такое число µ0 > 0, что для любого t ∈ Tκ либо µ(t) = 0, либо
µ(t) > µ0.
Тогда для любых 0 < η ≤ ρ и L > 0 найдутся такие ε0(η, L) > 0 и δ0 > 0, что для
0 < ε < ε0 и t0 ≤ t ≤ Lε−1 справедливы следующие утверждения:
1. Для любого допустимого управления v(t) системы (3) существует управление u(t)
системы (1) такое, что выполняется неравенство
‖x(t)− ξ(t)‖ ≤ η, (6)
где x(t) — решение системы (1), порожденное управлением u(t), а ξ(t) — решение систе-
мы (3), порожденное управлением v(t).
2. Для любого допустимого управления u(t) ∈ U системы (1) существует управле-
ние v(t) системы (3) такое, что выполняется (6).
Доказательство. Установим вначале первое утверждение теоремы. Итак, пусть v(t) —
допустимое управление системы (3). Согласно алгоритму, приведенному выше, поставим
ему в соответствие управление u(t).Обозначим траекторию движения системы (1), соот-
ветствующую управлению u(t), через x(t), а траекторию движения усредненной системы
под воздействием управления v(t) через ξ(t).
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 371
Оценим теперь близость траекторий x(t) и ξ(t) на промежутке временной шкалы дли-
ной порядка ε−1:
‖x(t)− ξ(t)‖ =
∥∥∥∥∥∥x0 + ε
t∫
t0
[f(s, x(s))−A(x(s))ϕ(s, u(s))] ∆s −
− x0 − ε
t∫
t0
[
f̄(ξ(s))−A(ξ(s))v(s)
]
∆s
∥∥∥∥∥∥ ≤
≤ ε
∥∥∥∥∥∥
t∫
t0
[f(s, x(s))− f(s, ξ(s))] ∆s+
t∫
t0
[
f(s, ξ(s))− f̄(ξ(s))
]
∆s+
+
t∫
t0
[A(x(s))−A(ξ(s))]ϕ(s, u(s))∆s+
t∫
t0
A(ξ(s)) [ϕ(s, u(s))− v(s)] ∆s
∥∥∥∥∥∥ ≤
≤ ε
t∫
t0
‖(s, x(s))− f(s, ξ(s))‖∆s
︸ ︷︷ ︸
B1
+ ε
t∫
t0
∥∥f(s, ξ(s))− f̄(ξ(s))
∥∥∆s
︸ ︷︷ ︸
B2
+
+ ε
t∫
t0
‖A(x(s))−A(ξ(s))‖ ‖ϕ(s, u(s))‖∆s
︸ ︷︷ ︸
B3
+ ε
t∫
t0
‖A(ξ(s)) [ϕ(s, u(s))− v(s)] ∆s
︸ ︷︷ ︸
B4
.
Оценки для первых двух слагаемых в последнем выражении были получены в [18] при
доказательстве аналога первой теоремы Боголюбова для систем на временных шкалах.
Они имеют следующий вид:
B1 ≤ ελ
t∫
t0
‖x(t)− ξ(t)‖∆s,
B2 ≤
2λML2
N
+ 2NF1
(
L
εδ
)
,
где N — количество точек δ-разбиения, а F1(T ) — убывающая к нулю при T → ∞ функ-
ция, существование которой гарантируется равномерной сходимостью пределов в (5).
Третье слагаемое в силу липшицевости матрицы A(x) и ограниченности функции
ϕ(t, u) можно оценить так:
B3 ≤ ε
t∫
t0
λAM‖x(s)− ξ(s)‖∆s.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
372 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
Для оценки четвертого слагаемого разобьем интеграл в сумму интегралов. Учитывая
обозначение ξi = ξ(ti), имеем
B4 = ε
t∫
t0
‖A(ξ(s))[ϕ(s, u(s))− v(s)]‖∆s =
=
∑
i∈I
ε
ti+1∫
ti
‖A(ξ(s)) [ϕ(s, u(s))− v(s)]−A(ξi) [ϕ(s, u(s))− v(s)] +
+ A(ξi) [ϕ(s, u(s))− v(s)]‖∆s ≤
≤ ε
∑
i∈I
ti+1∫
ti
‖[A(ξ(s))−A(ξi)] [ϕ(s, u(s))− v(s)]‖∆s+
+ ε
∑
i∈I
ti+1∫
ti
‖A(ξi) [ϕ(s, u(s))− v(s)] ‖∆s.
Далее, в силу равномерной сходимости к среднему найдется такая убывающая функция
F2(T ) −→
T→∞
0, что
‖ϕ(s, u(s))− v(s)‖ ≤ F2
(
L
εδ
)
.
Оценим теперь норму разности ‖ξ(s)− ξi‖:
‖ξ(s)− ξi‖ ≤
∥∥∥∥∥∥ε
s∫
ti
[
f̄(ξ(τ)) +A(ξ(τ))v(τ)
]
∆τ
∥∥∥∥∥∥ ≤ ε
s∫
ti
(
M +M2
)
∆τ.
Таким образом, для B4 имеем
B4 ≤ ε
∑
i∈I
ti+1∫
ti
λ‖ξ(s)− ξi‖‖ϕ(s, u(s))− v(s)‖∆s+
+ ε
∑
i∈I
M
ti+1∫
ti
‖ϕ(su(s))− v(s)‖∆s ≤
≤ ε
∑
i∈I
ti+1∫
ti
λε
(
M +M2
) s∫
ti
∆τF2
(
L
δε
)
∆s+ εM
t∫
t0
F2
(
L
δε
)
∆s ≤
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 373
≤ λε2(M +M2)F2
(
L
δε
)∑
i∈I
ti+1∫
ti
s∫
ti
∆τ∆s+ εMF2
(
L
δε
)
L
ε
≤
≤ λε2
(
M +M2
)
F2
(
L
δε
)∑
i∈I
ti+1∫
ti
(s− ti)∆s+MF2
(
L
δε
)
L.
Чтобы оценить интегралы в последней сумме, рассмотрим два случая. Если i ∈ Iδ, то
ti+1 − ti ≤ δ и потому
∫ ti+1
ti
(s− ti)∆s ≤ δ(ti+1 − ti) ≤ δ2. Если же i ∈ Iσ, то ti+1 = σ(ti) и∫ ti+1
ti
(s− ti)∆s =
∫ σ(ti)
ti
(s− ti)∆s = µ(ti)(ti − ti) = 0.
Воспользуемся теперь условием 5 теоремы. Пусть N0 =
L
εµ0
. Тогда для всех N > N0
и δ =
L
Nε
имеем δ < µ0, и сумму интегралов можно оценить следующим образом:
∑
i∈I
s∫
ti
(s− ti)∆s ≤
∑
i∈Iδ
δ2 =
∑
i∈Iδ
L2
N2ε2
<
L2
Nε2
.
Вернувшись к оценке B4, получим неравенство
B4 ≤ λ(M +M2)F2
(
L
δε
)
L2
N
+MF2
(
L
δε
)
L =
(
λ
(
M +M2
)
L2
N
+ML
)
F2
(
L
δε
)
.
В итоге имеем следующую оценку нормы разности траекторий движения систем (1) и (3):
‖x(t)− ξ(t)‖ ≤ ελ
t∫
t0
‖x(s)− ξ(s)‖∆s+
2λML2
N
+ 2NF1
(
L
δε
)
+
+ ελAM
t∫
t0
‖x(s)− ξ(s)‖∆s+
(
λL2(M +M2)
N
+ML
)
F2
(
L
δε
)
.
Группируя должным образом слагаемые в последнем выражении и применяя лемму Гро-
нуолла, получаем
‖x(t)− ξ(t)‖ ≤
[
2λML2
N
+ 2NF1
(
L
δε
)
+
(
λL2(M +M2)
N
+ML
)
F2
(
L
δε
)]
eε(λ+λAM)(t, t0).
Исходя из свойства монотонности экспоненциальной функции [15] (теорема 2.36, пункт
ii), имеем eε(λ+λAM)(t, t0) < eε(λ+λAM)
(
L
ε
, t0
)
. Далее, поскольку 1 + ε(λ+ λAM)µ(t) > 0,
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
374 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
по определению экспоненты через цилиндрическое преобразование [15, с. 59] (определе-
ние 2.30) получаем
eε(λ+λAM)
(
L
ε
, t0
)
=
= exp
L
ε∫
t0
ln(1 + ε (λ+ λAM)µ(τ))
µ(τ)
∆τ
<
< exp
L
ε∫
t0
ε(λ+ λAM)µ(τ)
µ(τ)
∆τ
=
= exp
ε(λ+ λAM)
L
ε∫
t0
∆τ
< e(λ+λAM)L.
Оценив таким образом экспоненту, выберем N достаточно большим, добившись выпол-
нения неравенства
2λML2
N
e(λ+λAM)L <
η
3
.
Зафиксировав теперь это значение N, выберем ε0 так, чтобы для всех ε ∈ (0, ε0) выпол-
нялись неравенства
2NF1
(
L
δε
)
e(λ+λAM)L <
η
3
,
F2
(
L
δε
)(
λL2(M +M2)
N
+ML
)
e(λ+λAM) <
η
3
.
Окончательно получаем оценку
‖x(t)− ξ(t)‖ < η,
и первое утверждение теоремы доказано.
Как видно из описания алгоритма соответствия управлений, доказательство второго
утверждения теоремы может быть проведено аналогичным образом.
Теорема 1 доказана.
Замечание 5. С практической точки зрения интерес представляет именно первая часть
алгоритма, которая позволяет любому управлению усредненной задачи (в силу автоном-
ности системы (3) мы считаем ее более простой) поставить в соответствие допустимое
управление исходной задачи (1), (2). Доказанная теорема позволяет утверждать, что со-
ответствующие траектории движения систем будут близки. Вторая же часть алгоритма
имеет лишь теоретическое значение.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 375
Используя метод усреднения для уравнений управляемого движения, нетрудно по-
лучить обоснование численно-асимптотического метода решения задачи оптимального
управления с терминальным критерием качества (1), (2). Для этого вначале докажем
несколько лемм, устанавливающих определенные соотношения между задачами опти-
мального управления с одинаковым критерием качества.
Итак, пусть имеются две задачи оптимального управления:
x∆(t) = f(t, x, u),
x(t0) = x0,
J [u] = Φ(x(T )) → min
u∈U
, (7)
y∆(t) = g(t, y, v),
y(t0) = x0,
J̄ [v] = Φ(y(T )) → min
v∈V
, (8)
где x ∈ Rn, y ∈ Rn, f(t, x, u) и g(t, y, u) — n-мерные вектор-функции, Φ(·) : Rn → R —
липшицева функция с константой Липшица λΦ, u(t) ∈ U — r-мерный вектор управления
задачи (7), U ∈ comp (Rr), v(t) ∈ V — s-мерный вектор управления (8), V ∈ comp (Rs).
Пусть задачи (7) и (8) имеют решение (возможно, не единственное). Обозначим через
u∗ оптимальное управление для задачи (7), а через v∗ — оптимальное управление для за-
дачи (8).
Лемма 2. Пусть существует допустимое управление v0 ∈ V такое, что соответ-
ствующая ему траектория y(t) близка к оптимальной траектории x∗(t) задачи (7), а
именно, для некоторого малого η1 > 0 и любого t ∈ [t0, T ] выполняется ‖x∗(t)− y(t)‖ <
< η1. Пусть при этом J [u∗] ≤ J̄ [v∗]. Тогда∣∣J [u∗]− J̄ [v∗]
∣∣ < λΦη1.
Доказательство. В силу липшицевости Φ(·) и специального выбора v0 имеем∣∣J [u∗]− J̄ [v0]
∣∣ = |Φ(x∗(T ))− Φ(y(T ))| ≤ λΦ|x∗(T )− y(T )| ≤ λΦη1,
т. е.
J [u∗] ≥ J̄ [v0]− λΦη1. (9)
Поскольку v∗ — оптимальное управление задачи (8), то
J̄ [v∗] ≤ J̄ [v0]. (10)
С учетом (9) и (10) получаем следующую цепочку неравенств:
J̄ [v0] ≥ J̄ [v∗] ≥ J [u∗] ≥ J̄ [v0]− λΦη1.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
376 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
Вычитая из неравенства J̄ [v∗], получаем
J [u∗]− J̄ [v∗] ≥ J̄ [v0]− J̄ [v∗]− λΦη1.
Тогда в силу (10) выполняется и неравенство
J [u∗]− J̄ [v∗] ≥ −λΦη1.
С другой стороны, по условию леммы
J [u∗]− J̄ [v∗] ≤ 0 < λΦη1.
Таким образом,
−λΦη ≤ J [u∗]− J̄ [v∗] < λΦη1,
и лемма доказана.
Лемма 3. Пусть существует такое управление u0 для задачи (7), что соответст-
вующая ему траектория x(t) близка к оптимальной траектории y∗(t) задачи (8), а
именно, для малого η2 > 0 и любого t ∈ [t0, T ] выполняется ‖x(t) − y∗(t)‖ < η2. Пусть
J [u∗] > J̄ [v∗]. Тогда ∣∣J [u∗]− J̄ [v∗]
∣∣ < λΦη2.
Доказательство. Как и при доказательстве леммы 2, получаем цепочку неравенств
J [u0] ≥ J [u∗] > J̄ [v∗] ≥ J [u0]− λΦη2.
Вычитая из неравенства J [u∗], получаем
J̄ [v∗]− J [u∗] ≥ J [u0]− J [u∗]− λΦη2.
Тогда выполняется и неравенство
J̄ [v∗]− J [u∗] ≥ −λΦη2,
или, иначе говоря,
J [u∗]− J̄ [v∗] ≤ λΦη2.
С другой стороны, по условию леммы
J [u∗]− J̄ [v∗] > 0 > −λΦη2.
Таким образом,
−λΦη < J [u∗]− J̄ [v∗] ≤ λΦη2,
и лемма доказана.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 377
Лемма 4. Пусть, наконец, существуют одновременно и u0, и v0 — допустимые управ-
ления, о которых шла речь в леммах 2 и 3. Тогда∣∣J [u∗]− J̄ [v∗]
∣∣ < λΦη3,
J [u0]− J [u∗] ≤ Cη3,
J̄ [v0]− J̄ [v∗] ≤ Cη3,
где η3 = max{η1, η2}.
Доказательство. Из двух величин J [u∗] и J̄ [v∗] одна обязательно больше (в крайнем
случае равна) другой. Поэтому справедлива либо лемма 2, либо лемма 3 и в любом случае
выполняется неравенство ∣∣J [u∗]− J̄ [v∗]
∣∣ < λΦη3.
Поэтому
J [u0]−J [u∗] = J [u0]−J̄ [v∗]+J̄ [v∗]−J [u∗]≤ |J [u0]−J̄ [v∗]|+|J̄ [v∗]−J [u∗]| ≤ λΦη2+λΦη3 <Cη3,
где C = 2λΦ.
Лемма 4 доказана.
Теорема 2. Пусть в области Q = {t ∈ T, x ∈ D ⊂ Rn, u ∈ U ⊂ Rr} выполнены
условия теоремы 1 и, кроме того,
1) Φ(·) : Rn → R липшицева с константой Липшица λΦ;
2) существуют оптимальное управление u∗(t) ∈ U задачи (1), (2) и оптимальное
управление v∗(t) ∈ V задачи (3), (4).
Тогда для любых 0 < η ≤ ρ и L > 0 найдется такое ε0(η, L) > 0, что для 0 < ε < ε0
и t0 ≤ t ≤ Lε−1 выполняются следующие неравенства:∣∣J [u∗]− J̄ [v∗]
∣∣ < η,
J [uv∗ ]− J [u∗] < η,
где uv∗ — управление системы (1), построенное по алгоритму и соответствующее оп-
тимальному управлению v∗ задачи (3), (4).
Доказательство. Для доказательства теоремы достаточно заметить, что алгоритм ме-
тода усреднения позволяет управлению v∗ поставить в соответствие такое допустимое
управление uv∗ задачи (1), (2), что соответствующие траектории будут близки:
‖xv∗(t)− ξ∗(t)‖ < η.
Обозначим через ε1 значение малого параметра ε, при котором, согласно теореме 1,
выполняется последнее неравенство.
С другой стороны, тот же алгоритм позволяет построить управление vu∗ усредненной
системы, соответствующее оптимальному управлению исходной системы. При этом по
теореме 1 найдется такое ε2, что соответствующие траектории также будут близки:
‖x∗(t)− ξu∗(t)‖ < η.
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
378 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО
Применяя лемму 4, непосредственно получаем оба неравенства теоремы.
Теорема 2 доказана.
Теорема 2 завершает обоснование численно-асимптотического метода решения зада-
чи оптимального управления (1), (2).
1. Крылов Н. М., Боголюбов Н. Н. Введение в нелинейную механику. — Киев: Изд-во АН СССР, 1937. —
363 с.
2. Боголюбов Н. Н., Митропольский Ю. А. Асимптотические методы в теории нелинейных колебаний. —
М.: Наука, 1974. — 503 с.
3. Моисеев Н. Н. Асимптотические методы нелинейной механики. — М.: Наука, 1981. — 400 с.
4. Бойцова И. А. Численно-асимптотический метод решения дискретных задач оптимального управле-
ния с быстрыми и медленными переменными // Вест. Белорус. гос. ун-та. Сер. I. — 2011. — № 1. —
С. 105 – 110.
5. Комлева Т. А., Плотникова Л. И., Плотников А. В., Скрипник Н. В. Усреднение нечетких управляе-
мых систем // Нелiнiйнi коливання. — 2011. — 14, № 3. — C. 325 – 332.
6. Плотников А. В. Асимптотическое исследование уравнений управляемого движения с многозначными
траекториями // Укр. мат. журн. — 1990. — 42, № 10. — С. 1409 – 1412.
7. Плотников В. А., Плотников А. В., Витюк А. Н. Дифференциальные уравнения с многозначной пра-
вой частью. Асимптотические методы. — Одесса: Астропринт, 1999. — 356 с.
8. Плотников В. А. Метод усреднения в задачах управления. — Киев; Одесса: Лыбидь, 1992. — 188 с.
9. Плотников В. А., Плотникова Л. И., Яровой А. Т. Метод усреднения дискретных систем и его прило-
жение к задачам управления // Нелiнiйнi коливання. — 2004. — 7, № 2. — С. 241 – 254.
10. Плотников В. А., Плотникова Л. И. Усреднение уравнений управляемого движения в метрическом
пространстве // Кибернетика и систем. анализ. — 1997. — № 4. — С. 175 – 180.
11. Плотников В. А., Кичмаренко О. Д. Усреднение управляемых уравнений с производной Хукухары //
Нелiнiйнi коливання. — 2006. — 9, № 3. — С. 376 – 385.
12. Плотников В. А., Кичмаренко О. Д. Усреднение уравнений с производной Хукухары, многозначным
управлением и запаздыванием // Вiсн. Одес. нац. ун-ту. Математика i механiка. — 2007. — 12, вип. 7. —
С. 130 – 139.
13. Plotnikov A. V. The averaging of control linear fuzzy differential equations // J. Adv. Res. Appl. Math. —
2011. — 3, № 3. — P. 1 – 20.
14. Hilger S. Ein Maßkettenkalkül mit Anwendung auf Zentrumsmannigfaltigkeiten: Ph.D. Thesis. — Univ.
Würzburg, 1988.
15. Bohner M., Peterson A. Dynamic equations on time scales: an introduction with applications. — Basel: Birk-
häuser, 2001. — 358 p.
16. Bohner M. et al. Advances in dynamic equations on time scales. — Springer, 2002. — 368 p.
17. Slavı́k A. Averaging dynamic equations on time scales // J. Math. Anal. and Appl. — 2012. — 388, № 2. —
P. 996 – 1012.
18. Огуленко О. П., Кичмаренко О. Д. Схема полного усереднения на временных шкалах // Вiсн. Одес.
нац. ун-ту. Математика i механiка. — 2012. — 17, вип. 4 (16). — C. 67 – 77.
Получено 06.09.13,
после доработки — 22.01.14
ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3
|