Усреднение задачи оптимального управления на временных шкалах

Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах.

Gespeichert in:
Bibliographische Detailangaben
Datum:2014
Hauptverfasser: Огуленко, А.П., Кичмаренко, О.Д.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут математики НАН України 2014
Schriftenreihe:Нелінійні коливання
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/177096
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Усреднение задачи оптимального управления на временных шкалах / А.П. Огуленко, О.Д. Кичмаренко // Нелінійні коливання. — 2014. — Т. 17, № 3. — С. 365-378 — Бібліогр.: 18 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-177096
record_format dspace
spelling irk-123456789-1770962021-02-11T01:27:38Z Усреднение задачи оптимального управления на временных шкалах Огуленко, А.П. Кичмаренко, О.Д. Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах. We substantiate a numerical-asymptotic method for solving an optimal control problem on time scales. 2014 Article Усреднение задачи оптимального управления на временных шкалах / А.П. Огуленко, О.Д. Кичмаренко // Нелінійні коливання. — 2014. — Т. 17, № 3. — С. 365-378 — Бібліогр.: 18 назв. — рос. 1562-3076 http://dspace.nbuv.gov.ua/handle/123456789/177096 517.9 ru Нелінійні коливання Інститут математики НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
description Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах.
format Article
author Огуленко, А.П.
Кичмаренко, О.Д.
spellingShingle Огуленко, А.П.
Кичмаренко, О.Д.
Усреднение задачи оптимального управления на временных шкалах
Нелінійні коливання
author_facet Огуленко, А.П.
Кичмаренко, О.Д.
author_sort Огуленко, А.П.
title Усреднение задачи оптимального управления на временных шкалах
title_short Усреднение задачи оптимального управления на временных шкалах
title_full Усреднение задачи оптимального управления на временных шкалах
title_fullStr Усреднение задачи оптимального управления на временных шкалах
title_full_unstemmed Усреднение задачи оптимального управления на временных шкалах
title_sort усреднение задачи оптимального управления на временных шкалах
publisher Інститут математики НАН України
publishDate 2014
url http://dspace.nbuv.gov.ua/handle/123456789/177096
citation_txt Усреднение задачи оптимального управления на временных шкалах / А.П. Огуленко, О.Д. Кичмаренко // Нелінійні коливання. — 2014. — Т. 17, № 3. — С. 365-378 — Бібліогр.: 18 назв. — рос.
series Нелінійні коливання
work_keys_str_mv AT ogulenkoap usredneniezadačioptimalʹnogoupravleniânavremennyhškalah
AT kičmarenkood usredneniezadačioptimalʹnogoupravleniânavremennyhškalah
first_indexed 2025-07-15T15:03:35Z
last_indexed 2025-07-15T15:03:35Z
_version_ 1837725716708327424
fulltext УДК 517.9 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НА ВРЕМЕННЫХ ШКАЛАХ А. П. Огуленко, О. Д. Кичмаренко Одес. нац. ун-т им. И. И. Мечникова Украина, 65026, Одесса, ул. Дворянская, 2 We substantiate a numerical-asymptotic method for solving an optimal control problem on time scales. Обґрунтовано чисельно-асимптотичний метод розв’язання задачi оптимального керування системою на часових шкалах. Введение. Выдающиеся результаты Н. М. Крылова и Н. Н. Боголюбова [1, 2] не толь- ко заложили основу новых теоретических исследований, но и нашли свое применение в различных отраслях прикладных наук. Н. Н. Моисеев [3] впервые применил метод усред- нения к исследованию задач оптимального управления. В работах В. А. Плотникова и его учеников метод усреднения применяется для новых классов задач управления системами с запаздыванием, с разрывной правой частью и импульсами, с многозначной и нечеткой правой частью, системами на дискретном времени и др. [4 – 13]. Такое разнообразие ма- тематических моделей возникло из-за необходимости исследования сложных процессов, существенно отличающихся своими особенностями. С появлением работы S. Hilger [14] принципиально изменился подход к пониманию природы времени в динамических системах. Понятие временной шкалы позволило по- строить общую теорию динамических систем, описывающую и непрерывные системы, и дискретные, и, что осoбенно важно, смешанные случаи. Подробное изложение теории динамических систем на временных шкалах представлено в [15, 16]. Метод усреднения для динамической системы на временной шкале приведен в [17], где рассматривается вопрос близости решения исходной системы на временной шкале и решения усредненного обобщенного дифференциального уравнения. Нами было получено обоснование схемы полного усреднения [18] (аналог теоремы Боголюбова) при условии, что усредненная система имеет ту же природу, что и исходная, причем обе динамические системы определены на одной и той же временной шкале. Целью данной работы является построение метода усреднения для управляемых систем на временных шкалах, установление алгоритма соответствия управлений исход- ной и усредненной систем и, наконец, обоснование численно-асимптотического метода решения задачи управления системой на временной шкале. Вспомогательные сведения. Приведем основные сведения о временных шкалах, кото- рые необходимы для изложения полученных результатов. Определения и понятия вводят- ся и обозначаются в соответствии с [15, 16]. Под временной шкалой понимается непустое замкнутое подмножество множества ве- щественных чисел, она обозначается символом T. Свойства временной шкалы определя- ются тремя функциями: c© А. П. Огуленко, О. Д. Кичмаренко, 2014 ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 365 366 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО 1) оператором перехода вперед: σ(t) = inf {s ∈ T : s > t} ; 2) оператором перехода назад: ρ(t) = sup {s ∈ T : s < t} (при этом полагается inf ∅ = supT и sup∅ = inf T); 3) функцией зернистости µ(t) = σ(t)− t. Поведение операторов перехода вперед и назад в конкретной точке временной шка- лы определяет тип этой точки. Соответствующая классификация точек временной шка- лы представлена в таблице. t справа рассеянная t < σ(t) t справа плотная t = σ(t) t слева рассеянная ρ(t) < t t слева плотная ρ(t) = t t изолированная ρ(t) < t < σ(t) t плотная ρ(t) = t = σ(t) Определим множество Tκ следующим образом: Tκ =  T \ {M}, если существует справа рассеянная точка M ∈ T : M = supT, supT < ∞, T — в противном случае. Далее полагаем [a, b] = {t ∈ T : a 6 t 6 b}. Определение 1. δ-Разбиение отрезка временной шкалы [t0, tf ] определим следующим образом: задавшись диаметром разбиения δ, положим первую точку разбиения равной t0, а дальнейшие точки определим по формуле ti =  sup (ti−1, ti−1 + δ], если ti−1 + δ ∈ Tκ, σ(ti−1), если ti−1 + δ /∈ Tκ. Замечание 1. Можно показать [16, c. 120], что построенное таким образом разбиение имеет следующие свойства: для любого i либо ti − ti−1 ≤ δ (будем считать, что в этом случае i ∈ Iδ), либо ti − ti−1 > δ и σ(ti−1) = ti (тогда i ∈ Iσ). Всюду далее полагаем N = |Iδ| + |Iσ|, т. е. N — количество точек δ-разбиения. Кроме того, мы используем обозначение I = Iδ ∪ Iσ для множества индексов всех точек δ-разбиения. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 367 Определение 2 [15]. Пусть f : T → R и t ∈ Tκ. Число f∆(t) называется ∆-производ- ной функции f в точке t, если для любого ε > 0 найдется такая окрестность U точки t (т. е. U = (t− δ, t+ δ) ∩ T, δ < 0), что |f(σ(t))− f(s)− f∆(t)(σ(t)− s)| ≤ ε|σ(t)− s| ∀s ∈ U. Определение 3 [15]. Если f∆(t) существует для любого t ∈ Tκ, то f : T → R на- зывается ∆-дифференцируемой на Tκ. Функция f∆(t) : Tκ → R называется дельта- производной функции f на Tκ. Если f дифференцируема по t, то f(σ(t)) = f(t) + µ(t)f∆(t). Определение 4 [15]. Функция f : T → R называется регулярной, если во всех плот- ных справа точках временной шкалы T она имеет конечные правосторонние пределы, а во всех слева плотных точках — конечные левосторонние пределы. Определение 5 [15]. Функция f : T → R называется rd-непрерывной, если в справа плотных точках она непрерывна, а в слева плотных точках имеет конечные левосто- ронние пределы. Множество таких функций обозначается Crd = Crd(T), а множество дифференцируемых функций, производная которых rd-непрерывна, обозначается как C1 rd = C1 rd(T). Определение 6 [15]. Для любой регулярной функции f(t) существует функция F, дифференцируемая в области D, такая, что для всех t ∈ D выполняется равенство F∆(t) = f(t). Эта функция называется предпервообразной для f(t) и определяется она неоднознач- но. Неопределенный интеграл на временной шкале имеет вид∫ f(t)∆t = F (t) + C, где C — произвольная константа интегрирования, а F (t) — предпервообразная для f(t). Далее, если для всех t ∈ Tκ выполняется F∆(t) = f(t), где f : T → R — rd-непрерывная функция, то F (t) называется первообразной функции f(t). Если t0 ∈ T, то F (t) = t∫ t0 f(s)∆s для всех t. Определенный ∆-интеграл для любых r, s ∈ T определяется так: s∫ r f(t)∆t = F (s)− F (r). ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 368 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО Определение 7 [15]. Пусть T — временная шкала и X — банахово пространство. Функцию f : T×X → X будем называть: 1) rd-непрерывной, если функция g(t) = f(t, x(t)) rd-непрерывна для любой непрерыв- ной функции x : T → X; 2) ограниченной в области Q ⊂ T ×X, если существует константа M > 0 такая, что ‖f(t, x)‖ ≤ M для любой точки (t, x) ∈ Q; 3) липшицевой по x в области Q ⊂ T×X, если существует константа λ > 0 такая, что ‖f(t, x1)− f(t, x2)‖ ≤ λ‖x1 − x2‖ ∀(t, x1), (t, x2) ∈ Q. Определение 8 [15]. Функцию p : T → R будем называть регрессивной, если 1 +mu(t)p(t) 6= 0, t ∈ Tκ. Множество регрессивных и rd-непрерывных функций обозначаетсяR = R(T). Как показано в [15], функции p из классаR можно поставить в соответствие функцию ep(t, s), которая по своим свойствам является аналогом экспоненты, определенной на R. В дальнейшем понадобится также неравенство Гронуолла, которое мы сформулиру- ем в виде следующей леммы. Лемма 1 (неравенство Гронуолла, [15]). Пусть y — rd-непрерывная на T функция, p ∈ R+, p ≥ 0, и α ∈ R. Если выполняется неравенство y(t) ≤ α+ t∫ t0 y(τ)p(τ)∆τ, τ ∈ T, то y(t) ≤ αep(t, t0), τ ∈ T. Основные результаты. Рассмотрим задачу оптимального управления системой на вре- менной шкале x∆(t) = ε[f(t, x(t)) +A(x(t))ϕ(t, u(t))], (1) x(t0) = x0, с терминальным функционалом качества min J [u] = Φ(x(t1)). (2) Здесь T — временная шкала — непустое замкнутое подмножество из R, supT = +∞, t ∈ T — время, x ∈ Rn, x∆ — ∆-производная, ε > 0 — малый параметр, f(t, x) — n- мерная вектор-функция, A(x) — (n × m)-матрица, ϕ(t, u) — m-мерная вектор-функция, Φ(·) : Rn → R, u(t) ∈ U — r-мерный вектор управления, U ∈ comp (Rr), t0 < inf T. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 369 Задаче (1), (2) поставим в соответствие усредненную задачу оптимального управле- ния системой на той же временной шкале ξ∆ = ε[f̄(ξ) +A(ξ)v], (3) ξ(t0) = x0, с критерием качества min J̄ [v] = Φ(ξ(t1)). (4) Усреднение проводится следующим образом: f̄(x) = lim T→∞ T∈T 1 T T∫ t0 f(t, x)∆t, (5) v ∈ V, V = co  lim T→∞ T∈T 1 T T∫ t0 ϕ(t, U)∆t  . Последний интеграл в (5) понимается как аналог интеграла Аумана на временной шкале, а сходимость соответствующего предела — в смысле метрики Хаусдорфа. Рассмотрим теперь алгоритм, который позволяет установить соответствие между до- пустимыми управлениями задач (1), (2) и (3), (4). Пусть сначала задано допустимое управ- ление v(t) ∈ V усредненной задачи. Поставим ему в соответствие управление u(t) ∈ U исходной задачи следующим образом: 1) зададимся некоторым δ-разбиением временной шкалы T, точки которого обозна- чим ti; 2) вычислим точки vi = 1 ti+1 − ti ∫ ti+1 ti v(s)∆s, i = 0, 1, 2, . . .; 3) построим управление u(t) = {ui(t), ti ≤ t < ti+1}, где ui(t) — решение задачи минимизации нормы ∥∥∥∥ 1 ti+1 − ti ∫ ti+1 ti ϕ(t, u(t))∆t− vi ∥∥∥∥ , т. е. ui(t) = argmin u(t)∈U ∥∥∥∥∥∥ 1 ti+1 − ti ti+1∫ ti ϕ(t, u(t))∆t− vi ∥∥∥∥∥∥ . Замечание 2. Можно показать, что множество точек 1 ti+1 − ti ti+1∫ ti ϕ(t, u(t))∆t, u(t) ∈ U  является выпуклым компактом. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 370 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО Замечание 3. Управление ui(t), вообще говоря, находится неоднозначным образом. Обратно, управлению u(t) ∈ U исходной задачи поставим в соответствие управление v(t) ∈ V усредненной задачи следующим образом: 1) зафиксируем δ-разбиение T, определенное выше; 2) вычислим точки wi = 1 ti+1 − ti ∫ ti+1 ti ϕ(t, ui(t))∆t, i = 0, 1, 2, . . .; 3) построим управление v(t) = {vi, ti ≤ t < ti+1}, где vi(t) находится из условия vi = arg min v∈V ‖wi − v‖. Замечание 4. Управление vi, вообще говоря, находится неоднозначным образом. Следующая теорема дает обоснование применения метода усреднения для уравнений управляемого движения систем (1) и (3). Теорема 1. Пусть в области Q = {t ∈ T, x ∈ D ⊂ Rn, u ∈ U ⊂ Rr} выполнены сле- дующие условия: 1) функция f(t, x) rd-непрерывна по t, регрессивна и для нее выполнены условия су- ществования и единственности решения задачи Коши, причем для любого (t, x) ∈ Q ‖f(t, x)‖ ≤ M, M > 0, f(t, x) липшицева по x с константой λ > 0; 2) функция A(x) удовлетворяет условию Липшица по x с постоянной λA и ограни- чена константой M ; 3) функция ϕ(t, u) rd-непрерывна по t и непрерывна по u, ограничена константой M ; 4) для любых допустимых управлений v(t) решение ξ(t) усредненной системы (3) с начальным условием ξ(t0) = x0 ∈ D′ ⊂ D вместе с ρ-окрестностью лежит в облас- ти D; 5) существует такое число µ0 > 0, что для любого t ∈ Tκ либо µ(t) = 0, либо µ(t) > µ0. Тогда для любых 0 < η ≤ ρ и L > 0 найдутся такие ε0(η, L) > 0 и δ0 > 0, что для 0 < ε < ε0 и t0 ≤ t ≤ Lε−1 справедливы следующие утверждения: 1. Для любого допустимого управления v(t) системы (3) существует управление u(t) системы (1) такое, что выполняется неравенство ‖x(t)− ξ(t)‖ ≤ η, (6) где x(t) — решение системы (1), порожденное управлением u(t), а ξ(t) — решение систе- мы (3), порожденное управлением v(t). 2. Для любого допустимого управления u(t) ∈ U системы (1) существует управле- ние v(t) системы (3) такое, что выполняется (6). Доказательство. Установим вначале первое утверждение теоремы. Итак, пусть v(t) — допустимое управление системы (3). Согласно алгоритму, приведенному выше, поставим ему в соответствие управление u(t).Обозначим траекторию движения системы (1), соот- ветствующую управлению u(t), через x(t), а траекторию движения усредненной системы под воздействием управления v(t) через ξ(t). ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 371 Оценим теперь близость траекторий x(t) и ξ(t) на промежутке временной шкалы дли- ной порядка ε−1: ‖x(t)− ξ(t)‖ = ∥∥∥∥∥∥x0 + ε t∫ t0 [f(s, x(s))−A(x(s))ϕ(s, u(s))] ∆s − − x0 − ε t∫ t0 [ f̄(ξ(s))−A(ξ(s))v(s) ] ∆s ∥∥∥∥∥∥ ≤ ≤ ε ∥∥∥∥∥∥ t∫ t0 [f(s, x(s))− f(s, ξ(s))] ∆s+ t∫ t0 [ f(s, ξ(s))− f̄(ξ(s)) ] ∆s+ + t∫ t0 [A(x(s))−A(ξ(s))]ϕ(s, u(s))∆s+ t∫ t0 A(ξ(s)) [ϕ(s, u(s))− v(s)] ∆s ∥∥∥∥∥∥ ≤ ≤ ε t∫ t0 ‖(s, x(s))− f(s, ξ(s))‖∆s ︸ ︷︷ ︸ B1 + ε t∫ t0 ∥∥f(s, ξ(s))− f̄(ξ(s)) ∥∥∆s ︸ ︷︷ ︸ B2 + + ε t∫ t0 ‖A(x(s))−A(ξ(s))‖ ‖ϕ(s, u(s))‖∆s ︸ ︷︷ ︸ B3 + ε t∫ t0 ‖A(ξ(s)) [ϕ(s, u(s))− v(s)] ∆s ︸ ︷︷ ︸ B4 . Оценки для первых двух слагаемых в последнем выражении были получены в [18] при доказательстве аналога первой теоремы Боголюбова для систем на временных шкалах. Они имеют следующий вид: B1 ≤ ελ t∫ t0 ‖x(t)− ξ(t)‖∆s, B2 ≤ 2λML2 N + 2NF1 ( L εδ ) , где N — количество точек δ-разбиения, а F1(T ) — убывающая к нулю при T → ∞ функ- ция, существование которой гарантируется равномерной сходимостью пределов в (5). Третье слагаемое в силу липшицевости матрицы A(x) и ограниченности функции ϕ(t, u) можно оценить так: B3 ≤ ε t∫ t0 λAM‖x(s)− ξ(s)‖∆s. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 372 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО Для оценки четвертого слагаемого разобьем интеграл в сумму интегралов. Учитывая обозначение ξi = ξ(ti), имеем B4 = ε t∫ t0 ‖A(ξ(s))[ϕ(s, u(s))− v(s)]‖∆s = = ∑ i∈I ε ti+1∫ ti ‖A(ξ(s)) [ϕ(s, u(s))− v(s)]−A(ξi) [ϕ(s, u(s))− v(s)] + + A(ξi) [ϕ(s, u(s))− v(s)]‖∆s ≤ ≤ ε ∑ i∈I ti+1∫ ti ‖[A(ξ(s))−A(ξi)] [ϕ(s, u(s))− v(s)]‖∆s+ + ε ∑ i∈I ti+1∫ ti ‖A(ξi) [ϕ(s, u(s))− v(s)] ‖∆s. Далее, в силу равномерной сходимости к среднему найдется такая убывающая функция F2(T ) −→ T→∞ 0, что ‖ϕ(s, u(s))− v(s)‖ ≤ F2 ( L εδ ) . Оценим теперь норму разности ‖ξ(s)− ξi‖: ‖ξ(s)− ξi‖ ≤ ∥∥∥∥∥∥ε s∫ ti [ f̄(ξ(τ)) +A(ξ(τ))v(τ) ] ∆τ ∥∥∥∥∥∥ ≤ ε s∫ ti ( M +M2 ) ∆τ. Таким образом, для B4 имеем B4 ≤ ε ∑ i∈I ti+1∫ ti λ‖ξ(s)− ξi‖‖ϕ(s, u(s))− v(s)‖∆s+ + ε ∑ i∈I M ti+1∫ ti ‖ϕ(su(s))− v(s)‖∆s ≤ ≤ ε ∑ i∈I ti+1∫ ti λε ( M +M2 ) s∫ ti ∆τF2 ( L δε ) ∆s+ εM t∫ t0 F2 ( L δε ) ∆s ≤ ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 373 ≤ λε2(M +M2)F2 ( L δε )∑ i∈I ti+1∫ ti s∫ ti ∆τ∆s+ εMF2 ( L δε ) L ε ≤ ≤ λε2 ( M +M2 ) F2 ( L δε )∑ i∈I ti+1∫ ti (s− ti)∆s+MF2 ( L δε ) L. Чтобы оценить интегралы в последней сумме, рассмотрим два случая. Если i ∈ Iδ, то ti+1 − ti ≤ δ и потому ∫ ti+1 ti (s− ti)∆s ≤ δ(ti+1 − ti) ≤ δ2. Если же i ∈ Iσ, то ti+1 = σ(ti) и∫ ti+1 ti (s− ti)∆s = ∫ σ(ti) ti (s− ti)∆s = µ(ti)(ti − ti) = 0. Воспользуемся теперь условием 5 теоремы. Пусть N0 = L εµ0 . Тогда для всех N > N0 и δ = L Nε имеем δ < µ0, и сумму интегралов можно оценить следующим образом: ∑ i∈I s∫ ti (s− ti)∆s ≤ ∑ i∈Iδ δ2 = ∑ i∈Iδ L2 N2ε2 < L2 Nε2 . Вернувшись к оценке B4, получим неравенство B4 ≤ λ(M +M2)F2 ( L δε ) L2 N +MF2 ( L δε ) L = ( λ ( M +M2 ) L2 N +ML ) F2 ( L δε ) . В итоге имеем следующую оценку нормы разности траекторий движения систем (1) и (3): ‖x(t)− ξ(t)‖ ≤ ελ t∫ t0 ‖x(s)− ξ(s)‖∆s+ 2λML2 N + 2NF1 ( L δε ) + + ελAM t∫ t0 ‖x(s)− ξ(s)‖∆s+ ( λL2(M +M2) N +ML ) F2 ( L δε ) . Группируя должным образом слагаемые в последнем выражении и применяя лемму Гро- нуолла, получаем ‖x(t)− ξ(t)‖ ≤ [ 2λML2 N + 2NF1 ( L δε ) + ( λL2(M +M2) N +ML ) F2 ( L δε )] eε(λ+λAM)(t, t0). Исходя из свойства монотонности экспоненциальной функции [15] (теорема 2.36, пункт ii), имеем eε(λ+λAM)(t, t0) < eε(λ+λAM) ( L ε , t0 ) . Далее, поскольку 1 + ε(λ+ λAM)µ(t) > 0, ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 374 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО по определению экспоненты через цилиндрическое преобразование [15, с. 59] (определе- ние 2.30) получаем eε(λ+λAM) ( L ε , t0 ) = = exp  L ε∫ t0 ln(1 + ε (λ+ λAM)µ(τ)) µ(τ) ∆τ  < < exp  L ε∫ t0 ε(λ+ λAM)µ(τ) µ(τ) ∆τ = = exp ε(λ+ λAM) L ε∫ t0 ∆τ < e(λ+λAM)L. Оценив таким образом экспоненту, выберем N достаточно большим, добившись выпол- нения неравенства 2λML2 N e(λ+λAM)L < η 3 . Зафиксировав теперь это значение N, выберем ε0 так, чтобы для всех ε ∈ (0, ε0) выпол- нялись неравенства 2NF1 ( L δε ) e(λ+λAM)L < η 3 , F2 ( L δε )( λL2(M +M2) N +ML ) e(λ+λAM) < η 3 . Окончательно получаем оценку ‖x(t)− ξ(t)‖ < η, и первое утверждение теоремы доказано. Как видно из описания алгоритма соответствия управлений, доказательство второго утверждения теоремы может быть проведено аналогичным образом. Теорема 1 доказана. Замечание 5. С практической точки зрения интерес представляет именно первая часть алгоритма, которая позволяет любому управлению усредненной задачи (в силу автоном- ности системы (3) мы считаем ее более простой) поставить в соответствие допустимое управление исходной задачи (1), (2). Доказанная теорема позволяет утверждать, что со- ответствующие траектории движения систем будут близки. Вторая же часть алгоритма имеет лишь теоретическое значение. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 375 Используя метод усреднения для уравнений управляемого движения, нетрудно по- лучить обоснование численно-асимптотического метода решения задачи оптимального управления с терминальным критерием качества (1), (2). Для этого вначале докажем несколько лемм, устанавливающих определенные соотношения между задачами опти- мального управления с одинаковым критерием качества. Итак, пусть имеются две задачи оптимального управления: x∆(t) = f(t, x, u), x(t0) = x0, J [u] = Φ(x(T )) → min u∈U , (7) y∆(t) = g(t, y, v), y(t0) = x0, J̄ [v] = Φ(y(T )) → min v∈V , (8) где x ∈ Rn, y ∈ Rn, f(t, x, u) и g(t, y, u) — n-мерные вектор-функции, Φ(·) : Rn → R — липшицева функция с константой Липшица λΦ, u(t) ∈ U — r-мерный вектор управления задачи (7), U ∈ comp (Rr), v(t) ∈ V — s-мерный вектор управления (8), V ∈ comp (Rs). Пусть задачи (7) и (8) имеют решение (возможно, не единственное). Обозначим через u∗ оптимальное управление для задачи (7), а через v∗ — оптимальное управление для за- дачи (8). Лемма 2. Пусть существует допустимое управление v0 ∈ V такое, что соответ- ствующая ему траектория y(t) близка к оптимальной траектории x∗(t) задачи (7), а именно, для некоторого малого η1 > 0 и любого t ∈ [t0, T ] выполняется ‖x∗(t)− y(t)‖ < < η1. Пусть при этом J [u∗] ≤ J̄ [v∗]. Тогда∣∣J [u∗]− J̄ [v∗] ∣∣ < λΦη1. Доказательство. В силу липшицевости Φ(·) и специального выбора v0 имеем∣∣J [u∗]− J̄ [v0] ∣∣ = |Φ(x∗(T ))− Φ(y(T ))| ≤ λΦ|x∗(T )− y(T )| ≤ λΦη1, т. е. J [u∗] ≥ J̄ [v0]− λΦη1. (9) Поскольку v∗ — оптимальное управление задачи (8), то J̄ [v∗] ≤ J̄ [v0]. (10) С учетом (9) и (10) получаем следующую цепочку неравенств: J̄ [v0] ≥ J̄ [v∗] ≥ J [u∗] ≥ J̄ [v0]− λΦη1. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 376 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО Вычитая из неравенства J̄ [v∗], получаем J [u∗]− J̄ [v∗] ≥ J̄ [v0]− J̄ [v∗]− λΦη1. Тогда в силу (10) выполняется и неравенство J [u∗]− J̄ [v∗] ≥ −λΦη1. С другой стороны, по условию леммы J [u∗]− J̄ [v∗] ≤ 0 < λΦη1. Таким образом, −λΦη ≤ J [u∗]− J̄ [v∗] < λΦη1, и лемма доказана. Лемма 3. Пусть существует такое управление u0 для задачи (7), что соответст- вующая ему траектория x(t) близка к оптимальной траектории y∗(t) задачи (8), а именно, для малого η2 > 0 и любого t ∈ [t0, T ] выполняется ‖x(t) − y∗(t)‖ < η2. Пусть J [u∗] > J̄ [v∗]. Тогда ∣∣J [u∗]− J̄ [v∗] ∣∣ < λΦη2. Доказательство. Как и при доказательстве леммы 2, получаем цепочку неравенств J [u0] ≥ J [u∗] > J̄ [v∗] ≥ J [u0]− λΦη2. Вычитая из неравенства J [u∗], получаем J̄ [v∗]− J [u∗] ≥ J [u0]− J [u∗]− λΦη2. Тогда выполняется и неравенство J̄ [v∗]− J [u∗] ≥ −λΦη2, или, иначе говоря, J [u∗]− J̄ [v∗] ≤ λΦη2. С другой стороны, по условию леммы J [u∗]− J̄ [v∗] > 0 > −λΦη2. Таким образом, −λΦη < J [u∗]− J̄ [v∗] ≤ λΦη2, и лемма доказана. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 УСРЕДНЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ . . . 377 Лемма 4. Пусть, наконец, существуют одновременно и u0, и v0 — допустимые управ- ления, о которых шла речь в леммах 2 и 3. Тогда∣∣J [u∗]− J̄ [v∗] ∣∣ < λΦη3, J [u0]− J [u∗] ≤ Cη3, J̄ [v0]− J̄ [v∗] ≤ Cη3, где η3 = max{η1, η2}. Доказательство. Из двух величин J [u∗] и J̄ [v∗] одна обязательно больше (в крайнем случае равна) другой. Поэтому справедлива либо лемма 2, либо лемма 3 и в любом случае выполняется неравенство ∣∣J [u∗]− J̄ [v∗] ∣∣ < λΦη3. Поэтому J [u0]−J [u∗] = J [u0]−J̄ [v∗]+J̄ [v∗]−J [u∗]≤ |J [u0]−J̄ [v∗]|+|J̄ [v∗]−J [u∗]| ≤ λΦη2+λΦη3 <Cη3, где C = 2λΦ. Лемма 4 доказана. Теорема 2. Пусть в области Q = {t ∈ T, x ∈ D ⊂ Rn, u ∈ U ⊂ Rr} выполнены условия теоремы 1 и, кроме того, 1) Φ(·) : Rn → R липшицева с константой Липшица λΦ; 2) существуют оптимальное управление u∗(t) ∈ U задачи (1), (2) и оптимальное управление v∗(t) ∈ V задачи (3), (4). Тогда для любых 0 < η ≤ ρ и L > 0 найдется такое ε0(η, L) > 0, что для 0 < ε < ε0 и t0 ≤ t ≤ Lε−1 выполняются следующие неравенства:∣∣J [u∗]− J̄ [v∗] ∣∣ < η, J [uv∗ ]− J [u∗] < η, где uv∗ — управление системы (1), построенное по алгоритму и соответствующее оп- тимальному управлению v∗ задачи (3), (4). Доказательство. Для доказательства теоремы достаточно заметить, что алгоритм ме- тода усреднения позволяет управлению v∗ поставить в соответствие такое допустимое управление uv∗ задачи (1), (2), что соответствующие траектории будут близки: ‖xv∗(t)− ξ∗(t)‖ < η. Обозначим через ε1 значение малого параметра ε, при котором, согласно теореме 1, выполняется последнее неравенство. С другой стороны, тот же алгоритм позволяет построить управление vu∗ усредненной системы, соответствующее оптимальному управлению исходной системы. При этом по теореме 1 найдется такое ε2, что соответствующие траектории также будут близки: ‖x∗(t)− ξu∗(t)‖ < η. ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3 378 А. П. ОГУЛЕНКО, О. Д. КИЧМАРЕНКО Применяя лемму 4, непосредственно получаем оба неравенства теоремы. Теорема 2 доказана. Теорема 2 завершает обоснование численно-асимптотического метода решения зада- чи оптимального управления (1), (2). 1. Крылов Н. М., Боголюбов Н. Н. Введение в нелинейную механику. — Киев: Изд-во АН СССР, 1937. — 363 с. 2. Боголюбов Н. Н., Митропольский Ю. А. Асимптотические методы в теории нелинейных колебаний. — М.: Наука, 1974. — 503 с. 3. Моисеев Н. Н. Асимптотические методы нелинейной механики. — М.: Наука, 1981. — 400 с. 4. Бойцова И. А. Численно-асимптотический метод решения дискретных задач оптимального управле- ния с быстрыми и медленными переменными // Вест. Белорус. гос. ун-та. Сер. I. — 2011. — № 1. — С. 105 – 110. 5. Комлева Т. А., Плотникова Л. И., Плотников А. В., Скрипник Н. В. Усреднение нечетких управляе- мых систем // Нелiнiйнi коливання. — 2011. — 14, № 3. — C. 325 – 332. 6. Плотников А. В. Асимптотическое исследование уравнений управляемого движения с многозначными траекториями // Укр. мат. журн. — 1990. — 42, № 10. — С. 1409 – 1412. 7. Плотников В. А., Плотников А. В., Витюк А. Н. Дифференциальные уравнения с многозначной пра- вой частью. Асимптотические методы. — Одесса: Астропринт, 1999. — 356 с. 8. Плотников В. А. Метод усреднения в задачах управления. — Киев; Одесса: Лыбидь, 1992. — 188 с. 9. Плотников В. А., Плотникова Л. И., Яровой А. Т. Метод усреднения дискретных систем и его прило- жение к задачам управления // Нелiнiйнi коливання. — 2004. — 7, № 2. — С. 241 – 254. 10. Плотников В. А., Плотникова Л. И. Усреднение уравнений управляемого движения в метрическом пространстве // Кибернетика и систем. анализ. — 1997. — № 4. — С. 175 – 180. 11. Плотников В. А., Кичмаренко О. Д. Усреднение управляемых уравнений с производной Хукухары // Нелiнiйнi коливання. — 2006. — 9, № 3. — С. 376 – 385. 12. Плотников В. А., Кичмаренко О. Д. Усреднение уравнений с производной Хукухары, многозначным управлением и запаздыванием // Вiсн. Одес. нац. ун-ту. Математика i механiка. — 2007. — 12, вип. 7. — С. 130 – 139. 13. Plotnikov A. V. The averaging of control linear fuzzy differential equations // J. Adv. Res. Appl. Math. — 2011. — 3, № 3. — P. 1 – 20. 14. Hilger S. Ein Maßkettenkalkül mit Anwendung auf Zentrumsmannigfaltigkeiten: Ph.D. Thesis. — Univ. Würzburg, 1988. 15. Bohner M., Peterson A. Dynamic equations on time scales: an introduction with applications. — Basel: Birk- häuser, 2001. — 358 p. 16. Bohner M. et al. Advances in dynamic equations on time scales. — Springer, 2002. — 368 p. 17. Slavı́k A. Averaging dynamic equations on time scales // J. Math. Anal. and Appl. — 2012. — 388, № 2. — P. 996 – 1012. 18. Огуленко О. П., Кичмаренко О. Д. Схема полного усереднения на временных шкалах // Вiсн. Одес. нац. ун-ту. Математика i механiка. — 2012. — 17, вип. 4 (16). — C. 67 – 77. Получено 06.09.13, после доработки — 22.01.14 ISSN 1562-3076. Нелiнiйнi коливання, 2014, т . 17, N◦ 3