Задача оптимального керування процесом дифузії
У цій статті ми розглядаємо задачу оптимального керування процесом, який описується рівнянням дифузії. Критерій оптимальності є квадратичним із скінченною верхньою межею. Для розв’язування цієї задачі використовується метод динамічного програмування. В результаті отримано інтегродиференціальне рівня...
Saved in:
Date: | 2010 |
---|---|
Main Author: | |
Format: | Article |
Language: | Ukrainian |
Published: |
Інститут кібернетики ім. В.М. Глушкова НАН України
2010
|
Series: | Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки |
Online Access: | http://dspace.nbuv.gov.ua/handle/123456789/18619 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Cite this: | Задача оптимального керування процесом дифузії / М.М. Копець // Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки: зб. наук. пр. — Кам’янець-Подільський: Кам'янець-Подільськ. нац. ун-т, 2010. — Вип. 3. — С. 94-98. — Бібліогр.: 2 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-18619 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-186192011-04-07T12:04:39Z Задача оптимального керування процесом дифузії Копець, М.М. У цій статті ми розглядаємо задачу оптимального керування процесом, який описується рівнянням дифузії. Критерій оптимальності є квадратичним із скінченною верхньою межею. Для розв’язування цієї задачі використовується метод динамічного програмування. В результаті отримано інтегродиференціальне рівняння Ріккаті. За допомогою цього рівняння розв’язок задачі оптимального керування отримано в замкненій формі. In this paper we investigate the optimal control problem for the process which is described by the diffusion equation. The criterion of optimality is quadratic with a fixed, finite upper limit. For solving of this problem the method of dynamic programming is used. As result the integrodifferential equation Riccati is obtained. By means of this equation the solution of this optimal problem is obtained in closed form. 2010 Article Задача оптимального керування процесом дифузії / М.М. Копець // Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки: зб. наук. пр. — Кам’янець-Подільський: Кам'янець-Подільськ. нац. ун-т, 2010. — Вип. 3. — С. 94-98. — Бібліогр.: 2 назв. — укр. XXXX-0059 http://dspace.nbuv.gov.ua/handle/123456789/18619 519.863 uk Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки Інститут кібернетики ім. В.М. Глушкова НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
description |
У цій статті ми розглядаємо задачу оптимального керування процесом, який описується рівнянням дифузії. Критерій оптимальності є квадратичним із скінченною верхньою межею. Для розв’язування цієї задачі використовується метод динамічного програмування. В результаті отримано інтегродиференціальне рівняння Ріккаті. За допомогою цього рівняння розв’язок задачі оптимального керування отримано в замкненій формі. |
format |
Article |
author |
Копець, М.М. |
spellingShingle |
Копець, М.М. Задача оптимального керування процесом дифузії Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки |
author_facet |
Копець, М.М. |
author_sort |
Копець, М.М. |
title |
Задача оптимального керування процесом дифузії |
title_short |
Задача оптимального керування процесом дифузії |
title_full |
Задача оптимального керування процесом дифузії |
title_fullStr |
Задача оптимального керування процесом дифузії |
title_full_unstemmed |
Задача оптимального керування процесом дифузії |
title_sort |
задача оптимального керування процесом дифузії |
publisher |
Інститут кібернетики ім. В.М. Глушкова НАН України |
publishDate |
2010 |
url |
http://dspace.nbuv.gov.ua/handle/123456789/18619 |
citation_txt |
Задача оптимального керування процесом дифузії / М.М. Копець // Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки: зб. наук. пр. — Кам’янець-Подільський: Кам'янець-Подільськ. нац. ун-т, 2010. — Вип. 3. — С. 94-98. — Бібліогр.: 2 назв. — укр. |
series |
Математичне та комп'ютерне моделювання. Серія: Фізико-математичні науки |
work_keys_str_mv |
AT kopecʹmm zadačaoptimalʹnogokeruvannâprocesomdifuzíí |
first_indexed |
2025-07-02T19:35:12Z |
last_indexed |
2025-07-02T19:35:12Z |
_version_ |
1836565043665174528 |
fulltext |
Математичне та комп’ютерне моделювання
94 © М. М. Копець, 2010
functional series is summed by the own elements of the corresponding hy-
brid differential operator.
Keywords: functional series, Bessel functions, main solutions, hybrid
integral transform, influence functions, Green function, contact conditions,
condition of simple solvability, basic identity, logical chart.
Отримано: 6.02.2010
УДК 519.863
М. М. Копець, канд. фіз.-мат. наук
Національний технічний університет України ‹‹Київський політехні-
чний інститут››, м. Київ
ЗАДАЧА ОПТИМАЛЬНОГО КЕРУВАННЯ
ПРОЦЕСОМ ДИФУЗІЇ
У цій статті ми розглядаємо задачу оптимального керу-
вання процесом, який описується рівнянням дифузії. Крите-
рій оптимальності є квадратичним із скінченною верхньою
межею. Для розв’язування цієї задачі використовується ме-
тод динамічного програмування. В результаті отримано інте-
гродиференціальне рівняння Ріккаті. За допомогою цього рі-
вняння розв’язок задачі оптимального керування отримано в
замкненій формі.
Ключові слова: рівняння дифузії, інтегродиференціальне
рівняння Ріккаті, метод динамічного програмування, задача
оптимального керування.
Розглядається процес, що описується рівнянням дифузії
( ) ( ) ( )
2
2
2
, ,
, ,0 , 0 ,
z t x z t x
D b u t x t T x l
t x
∂ ∂
= + ≤ ≤ ≤ ≤
∂ ∂
(1)
де b , l > 0, T > 0 – задані дійсні числа, D – коефіцієнт дифузії [1,
с.185]. Початкова умова для рівняння (1) має вигляд
( ) ( )00,z x z x= , 0 x l≤ ≤ , (2)
де функція ( )0z x двічі неперервно диференційована по змінній x .
Задано також однорідні крайові умови
( ),0 0z t = , ( ), 0z t l = . (3)
Функція ( ),u t x , що входить в рівняння (1), називається керу-
ванням. Вважаємо, що керування належать до класу кусково неперер-
вних функцій. Далі розглядаємо функціонал
Серія: Фізико-математичні науки. Випуск 3
95
( )
0
( ) , ,
T
I u J z u t dt= ∫ , (4)
де
( ) ( ) ( ) ( )
2 2
2
0 0 0
, , , , ,
2 2
l l lq rJ z u t z t z t d d u t dλ μ μ λ λ λ= +∫ ∫ ∫ , (5)
q і r – задані дійсні числа.
Задача полягає в знаходженні такого керування ( )0 ,u t x , при якому
функціонал (4) із врахуванням співвідношень (1)-(3) досягає свого міні-
мального значення. Таке керування називається оптимальним.
Для знаходження розв'язку цієї задачі, припускаючи що він існує,
застосуємо метод динамічного програмування. Розглянемо функцію
( )
( )
( )
,
, min , ,
t t T
T
u t x t
S t z J z u t dt
′≤ ≤
′
′ ′= ∫ . (6)
Очевидно, що
( ), 0S T z = . (7)
Із співвідношення (6) безпосередньо знаходимо
( )( ) ( )( ), , , ,S t t z t t x S t z t x+ Δ + Δ − =
( )
( )
,
min , ,
t t t t
T
u t x t
J z u t dt
′≤ ≤ +Δ
′
′ ′− ∫ .
За допомогою очевидних міркувань із останнього співвідношен-
ня приходимо до функціонального рівняння Беллмана
( )
( )
( ) ( ) ( )
, 0
, , ,
min ,
l
u t x
S t z S t z z t
J z u d
t z t
λ
λ
⎧ ⎫∂ ∂ ∂⎪ ⎪− = +⎨ ⎬
∂ ∂ ∂⎪ ⎪⎩ ⎭
∫ , (8)
[2, с.419].
Функцію ( ),S t z шукаємо у вигляді
( ) ( ) ( ) ( )
0 0
1, , , , ,
2
l l
S t z P t z t z t d dλ μ λ μ μ λ= ∫ ∫ , (9)
де ( ) ( ), , , ,P t P tλ μ μ λ= – поки що невідома функція.
Частинна похідна функції ( ),S t z по змінній t дорівнює
( ) ( ) ( ) ( )
0 0
, , ,1 , ,
2
l lS t z P t
z t z t d d
t t
λ μ
λ μ μ λ
∂ ∂
=
∂ ∂∫ ∫ . (10)
Із співвідношення (9) безпосередньо отримаємо
Математичне та комп’ютерне моделювання
96
( ) ( ) ( ) ( ) ( )
0 0
, 1 , , , , , ,
2
l lS t z
P t z t d P t z t d
z
λ μ μ μ λ μ λ λ
⎡ ⎤∂
= +⎢ ⎥
∂ ⎢ ⎥⎣ ⎦
∫ ∫ .
Враховуючи рівняння (1), далі знаходимо, що
( ) ( )
0
, ,l S t z z t
d
z t
λ
λ
∂ ∂
=
∂ ∂∫
( ) ( ) ( ) ( ) ( )2
2
0 0 0
,
, , , , , ,
2
l l l z tD P t z t d P t z t d d
λ
λ μ μ μ λ μ λ λ λ
λ
⎡ ⎤ ∂
= + +⎢ ⎥
∂⎢ ⎥⎣ ⎦
∫ ∫ ∫
( ) ( ) ( ) ( ) ( )
2
0 0 0
, , , , , , ,
2
l l lb P t z t d P t z t d u t dλ μ μ μ λ μ λ λ λ λ
⎡ ⎤
+ +⎢ ⎥
⎢ ⎥⎣ ⎦
∫ ∫ ∫ .
Якщо функція ( ), ,P t λ μ має неперервні частинні похідні до
другого порядку включно по змінних λ та μ і задовольняє крайовим
умовам ( ), 0,P t μ = ( ), , 0P t λ = ( ), ,P t l μ = ( ), , 0P t lλ = , то очевидною є
така рівність
( ) ( ) ( ) ( ) ( )2
2
0 0 0
,
, , , , , ,
l l l z t
P t z t d P t z t d d
λ
λ μ μ μ λ μ λ λ λ
λ
⎡ ⎤ ∂
+ =⎢ ⎥
∂⎢ ⎥⎣ ⎦
∫ ∫ ∫
( ) ( ) ( ) ( ) ( ) ( )
2 2
2 2
0 0 0 0
, ,
, , , , , ,
l l l lz t z t
P t z t d d P t z t d d
λ μ
λ μ μ μ λ λ μ λ μ λ
λ μ
∂ ∂
= + =
∂ ∂∫ ∫ ∫ ∫
( ) ( ) ( ) ( ) ( ) ( )
2 2
2 2
0 0 0 0
, , , ,
, , , ,
l l l lP t P t
z t z t d d z t z t d d
λ μ λ μ
λ μ μ λ λ μ μ λ
λ μ
∂ ∂
= +
∂ ∂∫ ∫ ∫ ∫ .
Оптимальне керування ( )0 ,u t λ шукаємо у вигляді
( ) ( ) ( )
2
0 2
0
, , , ,
lbu t P t z t d
r
λ λ μ μ μ= − ∫ . (11)
У результаті співвідношення (5) буде мати вигляд
( ) ( ) ( )
2
0 0
, , ,
2
l lqJ z u z t z t d dλ μ μ λ= +∫ ∫
( ) ( ) ( ) ( )
4
2
0 0 0
, , , , , ,
2
l l lb P t P t d z t z t d d
r
λ τ τ μ τ λ μ μ λ+ ∫ ∫ ∫ ,
або
( ) ( ) ( ) ( ) ( )
4
2
2
0 0 0
1, , , , , , ,
2
l l lbJ z u q P t P t d z t z t d d
r
ϕ μ τ λ τ μ λ μ λ
⎡ ⎤
= +⎢ ⎥
⎢ ⎥⎣ ⎦
∫ ∫ ∫ .
Серія: Фізико-математичні науки. Випуск 3
97
Далі отримаємо, що
( ) ( ) ( )
0 0
, ,1 , ,
2
l l P t
z t z t d d
t
λ μ
λ μ μ λ
∂
− =
∂∫ ∫
( ) ( ) ( ) ( )
4
2
2
0 0 0
1 , , , , , ,
2
l l lbq P t P t d z t z t d d
r
ϕ μ τ λ τ μ λ μ λ
⎡ ⎤
= + +⎢ ⎥
⎢ ⎥⎣ ⎦
∫ ∫ ∫
( ) ( ) ( )
2
2
0 0
, ,
, ,
2
l l P tD z t z t d d
λ μ
λ μ μ λ
λ
∂
+ +
∂∫ ∫ (12)
( ) ( ) ( )
2
2
0 0
, ,
, ,
2
l l P tD z t z t d d
λ μ
λ μ μ λ
μ
∂
+
∂∫ ∫ ( ) ( )
4
2
0 0
, , ,
2
l lb P t z t d
r
λ μ μ μ
⎡
− +⎢
⎢⎣
∫ ∫
( ) ( ) ( ) ( )
0 0 0
, , , , , ,
l l l
P t z t P t z t d dλ μ λ λ θ θ θ λ
⎤
+ ⎥
⎥⎦
∫ ∫ ∫ .
Легко переконатися, що має місце рівність
( ) ( ) ( ) ( )
( ) ( )
( ) ( ) ( ) ( )
4
2
0 0 0
0
4
2
0 0 0
, , , , , ,
2
, , ,
, , , , , , .
l l l
l
l l l
b P t z t d P t z t
r
P t z t d d
b P t P t d z t z t d d
r
λ μ μ μ λ μ λ
λ θ θ θ λ
λ τ τ μ τ μ λ μ λ
⎡ ⎤
− + ×⎢ ⎥
⎢ ⎥⎣ ⎦
× =
= −
∫ ∫ ∫
∫
∫ ∫ ∫
(13)
Із врахуванням (13) після зведення подібних членів із рівності
(12) знаходимо
( ) ( ) ( )
( ) ( )
( ) ( ) ( ) ( )
0 0
2
2 2
0 0
4
2
0
, ,1 , ,
2
, , , ,1
2
, , , , , , .
l l
l l
l
P t
z t z t d d
t
P t P t
q D
b P t P t d z t z t d d
r
λ μ
λ μ μ λ
λ μ λ μ
λ μ
ϕ μ τ λ τ μ λ μ λ
∂
− =
∂
⎡ ⎛ ⎞∂ ∂
= + + −⎢ ⎜ ⎟
∂ ∂⎢ ⎝ ⎠⎣
⎤
− ⎥
⎥⎦
∫ ∫
∫ ∫
∫
(14)
Рівність (14) повинна виконуватись тотожно відносно z . Це
можливо у випадку, якщо функція ( ), ,P t λ μ є розв’язком такого рів-
няння
Математичне та комп’ютерне моделювання
98
( ) ( ) ( )
( ) ( )
2
2 2
4
2
0
, , , , , ,
, , , , , 0 , 0 .
l
P t P t P t
q D
t
b P t P t d l l
r
λ μ λ μ λ μ
λ μ
λ τ τ μ τ λ μ
⎛ ⎞∂ ∂ ∂
− = + + −⎜ ⎟⎜ ⎟∂ ∂ ∂⎝ ⎠
− ≤ ≤ ≤ ≤∫
(15)
Рівняння (15) називається інтегродиференціальним рівнянням
Ріккаті. Для того, щоб виконувалась умова (7), досить прирівняти
функцію ( ), ,P t λ μ до нуля при t T= , тобто
( ), , 0P T λ μ = , 0 lλ≤ ≤ , 0 lμ≤ ≤ . (16)
Отже, доведене таке твердження.
Теорема. Для задачі оптимізації (1)-(5) оптимальне керування
( )0 ,u t λ обчислюється за формулою (11), де функція ( ), ,P t λ μ є
розв’язком інтегродиференціального рівняння (15), задовольняє
умові (16), умові симетричності ( ), ,P t λ μ = ( ), ,P t μ λ та крайовим
умовам
( ) ( ) ( ) ( ),0, , , , ,0 , , 0P t P t l P t P t lμ μ λ λ= = = = .
Список використаних джерел:
1. Тихонов А. Н. Уравнения математической физики / А. Н. Тихонов,
А. А. Самарский. – М. : Наука, 1977. – 736 с.
2. Лурье К. А. Оптимальное управление в задачах математической физики /
К. А. Лурье. – М. : Наука, 1975. – 480 с.
In this paper we investigate the optimal control problem for the process
which is described by the diffusion equation. The criterion of optimality is
quadratic with a fixed, finite upper limit. For solving of this problem the
method of dynamic programming is used. As result the integrodifferential
equation Riccati is obtained. By means of this equation the solution of this
optimal problem is obtained in closed form.
Key words: diffusion equation, integrodifferential equation Riccati,
method of dynamic programming, optimal control problem.
Отримано: 02.06.2010
|