Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем
Розглядається задача визначення оптимального розподілу базових контрольних точок, на основі якого обернене відображення Кастельжо забезпечує найкраще наближення поліноміальних функцій Без’є–Бернштейна кривими та поверхнями Без’є. Вводяться критерії оптимальності системи базових контрольних точок, і...
Saved in:
Date: | 2006 |
---|---|
Main Author: | |
Format: | Article |
Language: | Ukrainian |
Published: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2006
|
Subjects: | |
Online Access: | http://dspace.nbuv.gov.ua/handle/123456789/13883 |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Journal Title: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Cite this: | Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем / О.Ю. Митник // Систем. дослідж. та інформ. технології. — 2006. — № 1. — С. 94-105. — Бібліогр.: 15 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-13883 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-138832013-02-13T02:35:54Z Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем Митник, О.Ю. Методи оптимізації, оптимальне управління і теорія ігор Розглядається задача визначення оптимального розподілу базових контрольних точок, на основі якого обернене відображення Кастельжо забезпечує найкраще наближення поліноміальних функцій Без’є–Бернштейна кривими та поверхнями Без’є. Вводяться критерії оптимальності системи базових контрольних точок, і для них наводяться відповідні оцінки. Запропоновано еволюційний метод побудови оптимального оберненого відображення Кастельжо в задачі ідентифікації нелінійних динамічних систем за допомогою нечітких нейронних моделей. The problem of determination of optimal distribution of the basic control points is considered, where the inverse Casteljau mapping provides the best approximation of the Bezier-Bernstein polynomial functions by the Bezier curves and surfaces. A number of optimality criteria for the system of basic control points are introduced, and appropriate estimations are adduced. An evolutional construction method for the inverse Casteljau mapping in the problem of nonlinear dynamic system identification using neurofuzzy models is proposed. Рассматривается задача определения оптимального распределения базовых контрольных точек, на основе которого обратное отображение Кастельжо обеспечивает самое лучшее приближение полиномиальных функций Безье–Бернштейна кривыми и поверхностями Безье. Вводятся критерии оптимальности системы базовых контрольных точек и для них приводятся соответствующие оценки. Предложен эволюционный метод построения оптимального обратного отображения Кастельжо в задаче идентификации нелинейных динамических систем с помощью нечетких нейронных моделей. 2006 Article Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем / О.Ю. Митник // Систем. дослідж. та інформ. технології. — 2006. — № 1. — С. 94-105. — Бібліогр.: 15 назв. — укр. 1681–6048 http://dspace.nbuv.gov.ua/handle/123456789/13883 519.85 uk Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Методи оптимізації, оптимальне управління і теорія ігор Методи оптимізації, оптимальне управління і теорія ігор |
spellingShingle |
Методи оптимізації, оптимальне управління і теорія ігор Методи оптимізації, оптимальне управління і теорія ігор Митник, О.Ю. Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем |
description |
Розглядається задача визначення оптимального розподілу базових контрольних точок, на основі якого обернене відображення Кастельжо забезпечує найкраще наближення поліноміальних функцій Без’є–Бернштейна кривими та поверхнями Без’є. Вводяться критерії оптимальності системи базових контрольних точок, і для них наводяться відповідні оцінки. Запропоновано еволюційний метод побудови оптимального оберненого відображення Кастельжо в задачі ідентифікації нелінійних динамічних систем за допомогою нечітких нейронних моделей. |
format |
Article |
author |
Митник, О.Ю. |
author_facet |
Митник, О.Ю. |
author_sort |
Митник, О.Ю. |
title |
Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем |
title_short |
Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем |
title_full |
Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем |
title_fullStr |
Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем |
title_full_unstemmed |
Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем |
title_sort |
регуляризація поліноміальних функцій без’є-бернштейна та її застосування в задачі ідентифікації нелінійних систем |
publisher |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України |
publishDate |
2006 |
topic_facet |
Методи оптимізації, оптимальне управління і теорія ігор |
url |
http://dspace.nbuv.gov.ua/handle/123456789/13883 |
citation_txt |
Регуляризація поліноміальних функцій Без’є-Бернштейна та її застосування в задачі ідентифікації нелінійних систем / О.Ю. Митник // Систем. дослідж. та інформ. технології. — 2006. — № 1. — С. 94-105. — Бібліогр.: 15 назв. — укр. |
work_keys_str_mv |
AT mitnikoû regulârizacíâpolínomíalʹnihfunkcíjbezêbernštejnataíízastosuvannâvzadačíídentifíkacíínelíníjnihsistem |
first_indexed |
2025-07-02T15:41:37Z |
last_indexed |
2025-07-02T15:41:37Z |
_version_ |
1836550348647432192 |
fulltext |
О.Ю. Митник, 2006
94 ISSN 1681–6048 System Research & Information Technologies, 2006, № 1
УДК 519.85
РЕГУЛЯРИЗАЦІЯ ПОЛІНОМІАЛЬНИХ ФУНКЦІЙ
БЕЗ’Є-БЕРНШТЕЙНА ТА ЇЇ ЗАСТОСУВАННЯ В ЗАДАЧІ
ІДЕНТИФІКАЦІЇ НЕЛІНІЙНИХ СИСТЕМ
О.Ю. МИТНИК
Розглядається задача визначення оптимального розподілу базових контроль-
них точок, на основі якого обернене відображення Кастельжо забезпечує най-
краще наближення поліноміальних функцій Без’є–Бернштейна кривими
та поверхнями Без’є. Вводяться критерії оптимальності системи базових
контрольних точок, і для них наводяться відповідні оцінки. Запропоновано
еволюційний метод побудови оптимального оберненого відображення
Кастельжо в задачі ідентифікації нелінійних динамічних систем за допомогою
нечітких нейронних моделей.
ВСТУП
Технологія створення векторних зображень за допомогою кривих винайдена
на початку 60-х років П’єром Без’є, інженером фірми Renault, і Полем де
Кастельжо (Кастельє), інженером компанії Citroen. Оскільки вони обидва
працювали над створенням креслень нових автомобілів, всі їх наробки до
певного часу не оприлюднювалися. Робота Поля де Кастельжо була завер-
шена першою, але так жодного разу і не публікувалася. П’єру Без’є пощас-
тило більше. Його іменем названо нову технологію, хоча математичні вира-
зи, відповідно до яких виконуються перетворення Без’є, винайдені, в
основному, паном де Кастельжо [1].
Математична теорія барицентричних координат і алгоритм Кастельжо,
які широко використовуються при побудові кривих та поверхонь Без’є в об-
ласті автоматизованого проектування трьохвимірних систем, застосовують-
ся і при побудові нечітких нейронних моделей для нелінійних динамічних
систем.
НЕЧІТКА ЛОГІКА В НЕЙРОННИХ СИСТЕМАХ
Оскільки нечітка логіка узагальнює поняття характеристичної функції буле-
вої логіки, то за допомогою лінгвістичного терму A , що визначається нечіт-
кою множиною з функцією належності ( ) ]1,0[∈xAµ , можна представити
нечітке твердження щодо x .
Класична нечітка логіка оперує з логічними функціями and, or, if(.)
then(.) над нечіткими змінними. Але якщо замість звичайних операторів min
та max застосовувати алгебраїчні оператори добутку та суми, то нечіткі мо-
делі стають більш гнучкими і забезпечують відповідність між нейронними
системами і нечіткою логікою, наприклад, якщо функції належності зада-
ються у вигляді радіальних базисних функцій або В-сплайнів [2]. Такі моде-
Регуляризація поліноміальних функцій Без’є–Бернштейна та її застосування в задачі ...
Системні дослідження та інформаційні технології, 2006, № 1 95
лі також полегшують формальне сприйняття нечіткої системи і відокрем-
люються від лінгвістичного апарату. В цьому випадку важливий такий ре-
зультат [3].
Теорема. Якщо алгебраїчні оператори використовуються для реалізації
функцій нечіткої логіки, дійсні значення входів представляються через
функції належності, для дефазифікації виходу використовується метод се-
реднього значення, то вихід узагальненої нечіткої нейронної системи буде
мати вигляд
( ) ( )∑
=
ℜ∈=
p
i
n
Ai iy
1
, xxx µω , (1)
де ( )xiA
µ — функції належності вектору входу x , які задовольняють
( ) 11 =∑ =
p
j A j xµ ; вагові коефіцієнти ∑ =
= p
j
c
jiji yc1ω , де c
jy — центр функції
належності виходу ( )yjB
µ ; ijc – вага правила: «якщо iA∈x , то jBy∈ »,
при цьому ]1,0[,11 ∈=∑ = ij
p
j ij cc ; ji BA , — лінгвістичні терми, визначені
відповідно на вхідних та вихідних змінних.
Висновок з теореми
Теорема показує, що нечітка нейронна нелінійна система може бути пред-
ставлена у вигляді лінійної у параметрах структури, яка дозволяє застосову-
вати швидкі та прості процедури навчання. При цьому постає питання про
вибір функцій належності.
ПОЛІНОМИ БЕРНШТЕЙНА ЯК ФУНКЦІЇ НАЛЕЖНОСТІ
Розглянемо алгоритм побудови нечітких нейронних моделей для нелінійних
динамічних систем, запропонований К. Харрісом [3, 4]. Основа цього підхо-
ду полягає у використанні поліноміальних функцій Без’є–Бернштейна однієї
та двох змінних як базисних для представлення виходу нелінійної системи у
вигляді розкладу Габора–Колмогорова
( ) ( ) ( ) ( )∑ ∑∑
=
−
+==
+++=
n
p
n
pq
qppq
n
k
kk exxfxfff
1
1
11
0 , xx , (2)
де вектор [ ] nnT
nxx ℜ⊂Χ∈= ,...,1x — вхід нелінійної системи.
Для формування базисних поліноміальних функцій Без’є–Бернштейна
однієї та двох змінних використовуються лінійні комбінації відповідних по-
ліномів Бернштейна від векторів барицентричних координат u,s :
( ) ( ) ( )[ ]∑
=
=
d
j
k
d
jjkk xsBxf
0
ω , (3)
( ) ( ) ( )[ ]∑
=++
=
dkji
pq
d
ijkijkpqpq Bf xux ω , (4)
де [ ] 22, ℜ⊂Χ∈= T
qppq xxx . При цьому кожна функція Без’є–Бернштейна
відповідає виходу нечіткої нейронної підсистеми (1), а поліноми Бернштей-
О.Ю. Митник
ISSN 1681–6048 System Research & Information Technologies, 2006, № 1 96
на виступають у ролі функцій належності для представлення її входів. Та-
ким чином, вся нелінійна динамічна система (2) розглядається як суперпо-
зиція таких нейронних підсистем.
Барицентричні координати, в свою чергу, обчислюються за допомогою
оберненого алгоритму Кастельжо, який реалізує відображення
( ) ]1,0[: ∈→ΛΨ kkkk sx та
( ) [ ] { }1,0,0,: ≤+≥≥∆∈=→ΛΨ qpqp
T
qppqpqpqpq uuuuuuux .
Відображення будуються на основі наперед заданих множин базових
контрольних точок kΛ , pqΛ із використанням ітераційного чисельного ме-
тоду зворотного розповсюдження помилки або ж за допомогою швидкого
прямого аналітичного алгоритму [5]. Після обчислення барицентричних ко-
ординат знаходяться оцінки вагових коефіцієнтів ijkj ωω , відповідних рів-
нянь регресії (2)–(4) двохетапним методом найменших квадратів (МНК) або
ортогональним методом найменших квадратів (ОМНК) [6]. Тобто відбува-
ється навчання нейронних підсистем.
Зауважимо також, що задачі (3) і (4) можна інтерпретувати як задачі
наближення поліноміальних функцій однієї та двох змінних відповідно кри-
вими та поверхнями Без’є [7]. Надалі, для простоти викладення, не порушу-
ючи загальності, розглянемо задачу наближення поліноміальної функції од-
нієї змінної кривою Без’є, тобто задачу (3).
ПОСТАНОВКА ЗАДАЧІ РЕГУЛЯРИЗАЦІЇ ОБЕРНЕНОГО ВІДОБРАЖЕННЯ
КАСТЕЛЬЖО
Залишається визначити систему базових контрольних точок (СБКТ) *Λ , яка
б дозволила найкращим чином побудувати наближення поліноміальної фун-
кції однієї змінної кривою Без’є, тобто задовольняла певним критеріям оп-
тимальності. Тож під регуляризацією оберненого відображення Кастельжо
будемо розуміти визначення саме такої оптимальної СБКТ, що забезпечує
найкраще наближення поліноміальної функції кривою Без’є за певним кри-
терієм.
Введемо означення.
A-оптимальна СБКТ така, що мінімізує слід коваріаційної матриці оці-
нок вагових коефіцієнтів
( ) minˆcovtr:*
опт →Λ − ΩA , (5)
де T
d ],,[ 0 ωω =Ω — вектор вагових коефіцієнтів. Мінімізація сліду кова-
ріаційної матриці відповідає мінімізації середньої дисперсії оцінок коефіці-
єнтів, що має зміст суми квадратів головних піввісей еліпсоїду розсіювання
оцінок [7, 8].
D-оптимальна СБКТ така, що мінімізує значення визначника відповід-
ної коваріаційної матриці
( ) minˆcovdet:*
опт →Λ − ΩD . (6)
Регуляризація поліноміальних функцій Без’є–Бернштейна та її застосування в задачі ...
Системні дослідження та інформаційні технології, 2006, № 1 97
Такий визначник має зміст об’єму еліпсоїду розсіювання оцінок, тобто уза-
гальненої дисперсії оцінок невідомих вагових коефіцієнтів рівняння регре-
сії.
G-оптимальна СБКТ така, що мінімізує максимальну дисперсію спрог-
нозованих значень регресії
( ){ } minˆmax:*
опт →Λ
Χ∈
− xD
x
G , (7)
де дисперсія спрогнозованих значень ( ) ( ) ( )xxxD TbΩb ˆcovˆ = ; вектор ( ) =xb
( ) ( )( ) ( ) ( )( )[ ]Td
d
d xsBxsB ΛΛ= |,...,|0 , ( )Λ|xs — барицентричні координати, ви-
значені за допомогою оберненого відображення Кастельжо на основі СБКТ
Λ для ℜ⊂Χ∈x .
I-оптимальна СБКТ така, що мінімізує узагальнену дисперсію спрогно-
зованих значень регресії [9]
( ) ( ) minˆ:*
опт →=Λ ∫
Χ
− xdxDJI µ , (8)
де µ — рівномірна міра на просторі входу Χ .
Припускаючи, що похибки моделі (2) попарно некорельовані і мають
однакову скінченну дисперсію, тобто ( ) ( )2,0~ σNe x , коваріаційна матриця
матиме вигляд ( ) 12ˆcov
−
= AAΩ Tσ , де матриця ( )( ){ }
iji
d
j xsB Λ= |)(A ,
Nidj ,...,1;,...,0 == , N — розмір вхідної вибірки. Надалі будемо вважати
12 =σ , що не обмежує загальності задач (5–8).
Застосування теорії побудови оптимальних планів у нашому випадку
обмежується пасивною ідентифікацією, оскільки розглядаються нелінійні
динамічні системи, в яких неможливо ставити експеримент і задавати зна-
чення входів, наприклад, економічні системи. Тож мова йде про оптималь-
ний розподіл параметрів моделі, де в ролі параметрів виступають базові ко-
нтрольні точки. Як правило, A, D-оптимальність використовується для
побудови моделей, де важлива точність і якість оцінок коефіцієнтів регресії.
У той же час G, I-оптимальність ефективна для задач пошуку екстремуму
поверхні відгуку в заданій області. Важливо визначити, які з наведених оп-
тимізаційних задач ефективніші для визначення структури моделі, що за-
безпечує найменшу похибку при прогнозуванні.
ДЕЯКІ ОЦІНКИ ОПТИМАЛЬНОСТЕЙ
Оцінка I-оптимальності
Функціонал (8) легко спрощується до вигляду ( )ΩM ˆcovtr=J , де матриця
моментів вхідного простору ( ) ( ) ( )∫
Χ
= xdxxT µbbM . Дійсно,
( ) ( ) ( )( ) ( ) ==≡= ∫
Χ
xdxxJJ T µbΩbJ ˆcovtrtr
О.Ю. Митник
ISSN 1681–6048 System Research & Information Technologies, 2006, № 1 98
( ) ( )( ) ( ) ( ) ( ) ( )
== ∫∫
ΧΧ
ΩbbΩbb ˆcovtrˆcovtr xdxxxdxx TT µµ ,
оскільки для будь-яких квадратних матриць BA, виконується рівність
( ) ( )BAAB trtr = .
Цей результат значно полегшує обчислення показника I-оптимальності,
оскільки у багатьох випадках матрицю моментів можна визначити наперед.
Крім того, очевидно, що у випадку ортогональності векторів ( )xb матриця
моментів є одиничною матрицею і I-оптимальність зводиться до A-опти-
мальності.
Теорема 1. Оцінка поліномів Бернштейна. Будь-який поліном Берн-
штейна однієї змінної порядку d допускає оцінку зверху:
( ) ( ) ( ) ( )
( )ssd
ssBjs d
j
−
=≤∀∈∀
12
1:,1,0
π
ν ,
причому ( ) ( ) ( )ssB d
j ν≈ при djs /= .
Доведення. Поліноми Бернштейна однієї змінної порядку d мають ви-
гляд
( ) ( ) ( )( )jdjd
j ss
j
d
sB −−
= 1 ,
і до них, як і для будь-яких біноміальних розподілів, можна застосувати
нормальне наближення. Для довільного симетричного біноміального роз-
поділу справедливі такі оцінки його членів, які перенумеровані у залежності
від їх відстані до максимальної ймовірності [10]:
( )( ) ( )hkhrss
km
d
a kmdkm
k ~1 −−+ −
+
= , mdmk −−= ,...,0,..., , kmj += ,
де ssdsm ≤<−+= δδ 1, — індекс максимальної ймовірності розподілу;
( )sds
h
−
=
1
1 , ( ) 2/2
2
1 xexr −=
π
— густина нормального розподілу. Точ-
ність такого наближення детально розглядається в роботі [10]. Очевид-
но, що
( ) ( ) ( ) ( )
( )
( )sv
sds
hhraasBjs k
d
j =
−
=⋅≤=∀∈∀
π2
1
1
10~:,1,0 0 .
Це доводить оцінку зверху для поліномів Бернштейна. Крім того, оцінка
максимальної ймовірності ( )sa ν~0 є одночасно і оцінкою максимуму
кожного поліному Бернштейна при djs /→ .
[ ] ( ) ( ) ( ) ( ) ( )jj
jj
d
j
d
j ssd
sv
d
jsBsBjs
−
=
=≤∀∈∀
12
1~:,1,0
π
,
причому ( ) ( ) ( ) ( )j
d
kj
d
j sBsBk ≥∀ : (рис. 1).
Регуляризація поліноміальних функцій Без’є–Бернштейна та її застосування в задачі ...
Системні дослідження та інформаційні технології, 2006, № 1 99
Теорема 2. Оцінка сліду інформаційної матриці. Слід інформаційної
матриці від системи поліномів Бернштейна допускає наближення:
( ) ( )( )[ ]
( )∑∑∑
== = −
≈Λ=
N
i ii
d
j
N
i
i
d
j
T
sds
xsB
10 1
2)(
12
1|tr
π
AA . (9)
Доведення. Враховуючи наведені вище оцінки для поліномів Бернш-
тейна,
( ) ( )[ ] ( )[ ]
hx
h
kmd
mk
d
j
d
j dehkhhrsB
ξ
ξ
ξ
ξ
π
2
22
0
2 22
2
1~
=∞
∞−
−
→−
−==
=≈ ∫∑∑
( )ii
x
ssd
hdxeh
−
=== ∫
∞
∞−
−
12
1
222
1 2/2
πππ
.
Відповідно маємо для сліду інформаційної матриці таку оцінку (рис. 2):
( ) ( ) ( )[ ]
( )∑∑∑
== = −
≈=
N
i ii
N
i
d
j
i
d
j
T
sds
sB
11 0
2
12
1tr
π
AA .
Висновки з теореми
1. Очевидно, що чим ближчі барицентричні координати до центру (до
0,5), тим менше значення сліду інформаційної матриці.
2. При рівномірному розподілі барицентричної координати на [ ]1,0
можна перейти від граничних сум до визначеного інтегралу, який легко об-
числити через тригонометричну заміну
( )
( ) d
N
d
N
ss
ds
d
NT ππ
ππ 2212
~tr
1
0
==
−∫AA .
Рис. 1. Оцінка поліномів Бернштейна 4-го порядку зверху: )()( sB d
j ; )(sv
s 0 0,2 0,4 0,6 0,8 1
0,2
0,4
0,6
0,8
1
О.Ю. Митник
ISSN 1681–6048 System Research & Information Technologies, 2006, № 1 100
Оцінка A, D-оптимальності
Зазначимо, що коваріаційна матриця — це симетрична, позитивно визначе-
на матриця, власні числа якої дійсні та невід’ємні, а їх сума дорівнює сліду
матриці. За допомогою нерівностей між середнім арифметичним та середнім
геометричним можна отримати оцінку знизу для сліду коваріаційної матриці
( ) ( ) ( ) ≥+≥== +
==
−
∏∑ 1d
00
1 111trˆcovtr
d
i i
d
i i
T d
λλ
AAΩ
( ) ( ) ( )[ ] 12
1
0
2 tr11
−
−
=
+=
+≥ ∑ AAT
d
i
i dd λ , (10)
де 1−
iλ — власні числа коваріаційної матриці; iλ — власні числа інформа-
ційної матриці.
Аналогічно визначник коваріаційної матриці, який дорівнює добутку
власних чисел, також допускає оцінку знизу
( ) ( ) ( ) =
+≥==
−−
=
+
=
−
∑∏
1
0
1
0
1
11detˆcovdet
dd
i
i
d
d
i i
T d λ
λ
AAΩ
( ) ( )[ ] ( )
( )
1
1
111
12
11tr1
−−
=
+−−+
−
+≈+= ∑
d
N
i ii
ddTd
ssd
dd
π
AA . (11)
Очевидно, що ті розподіли барицентричних координат, для яких в
нерівностях (10), (11) мають місце рівності, тобто A, D-оптимальні розподі-
ли, співпадають і можуть визначатися умовою [8]
Рис. 2. Оцінка сліду інформаційної матриці ( 1=N ): )(tr AAT ; оцінка
)(tr AAT
s 0 0,2 0,4 0,6 0,8 1
0,2
0,4
0,6
0,8
1
Регуляризація поліноміальних функцій Без’є–Бернштейна та її застосування в задачі ...
Системні дослідження та інформаційні технології, 2006, № 1 101
( )
( ) 1
1
1
12
11 +
=
− Ι
−
+≈ ∑ d
N
i ii
T
sds
d
π
AA .
Але легко показати, що такої матриці не існує, адже поліноми Бернштейна, з
яких складається матриця A , додатні. Тож можна зробити висновок про те,
що оптимальність у нашому випадку це паритет двох критеріїв:
1. Кожна барицентрична координата знаходиться якомога ближче до
центру області визначення.
2. Барицентричні координати розташовані якомога далі одна від одної з
метою покращення обумовленості інформаційної матриці.
Зауважимо, що наведені вище оцінки знизу для A, D-оптимальностей не
слід використовувати як критерії мінімізації самих оптимальностей, тобто
мінімізація сліду чи визначника коваріаційної матриці не еквівалентна мак-
симізації сліду інформаційної матриці.
Зазначимо також, що для неперервних планів справедливою є теорема
еквівалентності [7], згідно якої неперервний D-оптимальний план є також і
G-оптимальним.
ЗАСТОСУВАННЯ ГЕНЕТИЧНОГО АЛГОРИТМУ ДЛЯ ВИЗНАЧЕННЯ
ОПТИМАЛЬНОГО РОЗПОДІЛУ БАЗОВИХ КОНТРОЛЬНИХ ТОЧОК
Відомі приклади успішного застосування генетичних алгоритмів (ГА) у за-
дачах оптимального планування експерименту [11], а також у деяких опти-
мізаційних задачах [12]. Для розв’язку оптимізаційних задач (5)–(8) пропо-
нується використовувати ГА, а саме його реалізацію з популяціями, які не
перекриваються [13]. Зазначимо, що в цьому випадку задачу (1), (4) можна
віднести до класу задач навчання нейронних систем еволюційними метода-
ми.
Об’єкти ГА в нашому випадку мають такий зміст. В якості гену висту-
пає базова контрольна точка. Набір алелей характеризує множину можливих
значень контрольних точок. Кожна особина (хромосома) складається з на-
бору генів, який відповідає системі контрольних точок. Мірою придатності
кожної особини, яка виражає той чи інший критерій оптимальності, висту-
пає цільова функція вигляду
( ) ( )Ω̂covtr~опт −Λ−AF , ( ) ( )Ω̂covdet~опт −Λ−DF ,
( ) ( ){ }xDFG
ˆmax~опт −Λ− , ( ) ( )ΩM ˆcovtr~опт −Λ−IF .
В результаті роботи ГА на тестових моделях отримані оптимальні роз-
поділи базових контрольних точок для різних розподілів вектору входу. При
цьому точність апроксимації і короткострокового прогнозування виходу си-
стеми за допомогою моделі К. Харріса зросла в декілька разів, оскільки на-
ведені вище оптимізації зменшують також і значення середньоквадратичної
похибки.
Окремою темою для досліджень в цьому напрямку є питання про збіж-
ність ГА. Хоч ГА іноді знаходить гарні розв’язки для складних задач, проте
теоретичних результатів щодо збіжних властивостей і умов збіжності дуже
мало. Одна із спроб дослідити ГА на збіжність — створення відповідної мо-
О.Ю. Митник
ISSN 1681–6048 System Research & Information Technologies, 2006, № 1 102
делі ланцюга Маркова та ймовірнісний аналіз збіжності найпридатнішої
особини до глобального екстремуму [14].
Для задач побудови довгострокового прогнозу проведення таких опти-
мізацій, як A, D, I, G, недостатньо, оскільки середньоквадратична похибка,
що використовується при побудові регресії на всіх точках вибірки, є внут-
рішнім критерієм системи. Для однозначного вибору моделі (параметрів
моделі), як правило, використовується принцип зовнішнього доповнення і,
відповідно, зовнішні критерії [15]. У нашому випадку в якості зовнішнього
доповнення використаємо додаткову перевірочну вибірку для такого крите-
рію оптимальності:
Оптимальна за виходом (О-оптимальна) СБКТ така, що мінімізує
штрафну функцію
( ) min,:*
опт →Λ − PP NNO DV Ω , (12)
яка може бути визначена в різний спосіб:
( ) ( )[ ] ( )[ ] ( ) Χ⊂∈=
PPP Nf
x
ffNN DxxexeExeEDV ,max,,, 2Ω ,
де похибка виходу моделі ( ) ( ) ( )xfxfxe f
ˆ−= є одночасно і похибкою на-
ближення поліноміальної функції Без’є–Бернштейна однієї змінної кривою
Без’є;
PND — перевірочна вибірка даних. При ( ) ( )[ ]xeEDV fNN PP
2, =Ω оп-
тимізаційна задача (12) виражає відомий критерій регулярності. Цільова фу-
нкція ГА для знаходження СБКТ оптимальної за виходом має вигляд
( ) ( )
PP NNO DVF ,~опт Ω−Λ− .
Мінімальну похибку прогнозу моделі К. Харріса було отримано саме із
застосуванням оптимальної за виходом СБКТ, яка забезпечувала оптималь-
не нечітке представлення входу.
ПОЛІНОМІАЛЬНІ ФУНКЦІЇ БЕЗ’Є–БЕРНШТЕЙНА ЯК ЧАСТКОВІ
ПРЕДСТАВЛЕННЯ
Метод групового врахування аргументів (МГВА) надає певну свободу у ви-
борі опорних функцій, які визначають часткове представлення для базових
моделей двох змінних. В класичному багаторядному МГВА використову-
ються лінійні та квадратичні представлення. Пропонується використовувати
поліноміальні функції Без’є–Бернштейна (ПФББ) двох змінних в якості та-
ких опорних функцій, при цьому відбір моделей проводити не тільки за
структурою, а й за параметрами, в ролі яких виступає СБКТ для побудови
найкращого наближення поліноміальних функцій поверхнею Без’є, яка буде
поверхнею відгуку для базової моделі.
Результати показали, що прогноз, складений МГВА з опорними по-
ліноміальними функціями Без’є–Бернштейна, побудованими на основі
О-оптимальної СБКТ, за показником середньоквадратичної похибки (СКП)
кращий від прогнозу як класичного багаторядного МГВА, так і методу
Регуляризація поліноміальних функцій Без’є–Бернштейна та її застосування в задачі ...
Системні дослідження та інформаційні технології, 2006, № 1 103
К. Харріса, навіть із застосуванням регуляризації оберненого відображення
Кастельжо.
РЕЗУЛЬТАТИ МОДЕЛЮВАННЯ ТА ЇХ АНАЛІЗ
Розглянемо модельний приклад [4]. Нехай нелінійна динамічна система за-
дана у вигляді
( ) ( ) ( )
( ) ( ) ( )
( ) ( )tete
tutyty
tuty
ty
s
s +−+
−−+−+
−+−
= 13,0
2111
11
2
2
,
де вхід системи ( )tus — рівномірно розподілений сигнал на ]1,1[− , і шумо-
ва складова ( ) ( )21,0,0~ Nte . Згенеровано вибірку із 40 основних і 10 переві-
рочних точок. Нелінійна система моделюється у вигляді
( ) ( )( ) ( ) ( )tetcetfty +−+= 1x ,
де ( ) ( ) ( ) ( )[ ]Tss tututyt 2,1,1 −−−=x .
При побудові моделей отримані результати наведені у таблиці та на
рис. 3.
Порівняльний аналіз методів
Метод Слід матриці
коваріації
Визначник матриці
коваріації
СКП прогнозу,
%
МГВА
Класичний 11919,82 755401 2,37
з опорними ПФББ
O-опт. 149140,66 3,42⋅1010 1,37
Алгоритм
Харріса
Класичний
(нерегуляризований) 253,56 156899,38 3,31
A-опт. 97,5 3317,78 3,26
D-опт. 100,68 3464,36 3,41
O-опт. 173,45 35721,34 2,99
Зазначимо, що дані за класичним багаторядним МГВА приведені по
останньому (другому) ряду, а за методом Харріса — по першій частковій
підсистемі. Як і очікувалось, A-оптимальність дає найменше значення сліду
матриці коваріації і, крім цього, показує менше значення визначника матри-
ці коваріації ніж D-оптимальність. Очевидно, це пов’язано із гіршою збіжні-
стю ГА на D-оптимальності. O-оптимальність стабільно забезпечує най-
менше значення СКП. Відповідні розподіли СБКТ показані на рис. 3. Як
видно з рисунку, A-, D-оптимізації дають більш густий розподіл, і конт-
рольні точки розміщуються щільніше одна до одної, що призводить, відпо-
відно, до збільшення міжбарицентричних відстаней. Тож перевага A,
D-оптимальностей полягає у зниженні чутливості побудованих моделей.
Параметри ГА емпірично були підібрані такими:
• розмір популяції — 30 осіб;
О.Ю. Митник
ISSN 1681–6048 System Research & Information Technologies, 2006, № 1 104
• рівень мутацій — 1%;
• рівень схрещування — 60%;
• кількість поколінь — 400.
ВИСНОВКИ
За допомогою регуляризації оберненого відображення Кастельжо і, від-
повідно, поліноміальних функцій Без’є–Бернштейна можна досягти певного
зниження абсолютної і середньоквадратичної похибок при застосуванні ал-
горитму К. Харріса для задач наближення та прогнозування. Але основною
перевагою є зниження чутливості побудованих моделей і вирішення питан-
ня про розміщення базових контрольних точок, яке до цього часу залишало-
ся відкритим. Тепер можна дати деякі рекомендації по застосуванню алго-
ритму Харріса. Зокрема, при побудові систем реального часу, де питання
швидкодії алгоритму стоїть на першому місці, доцільно використовувати
удосконалений алгоритм, де аналітичність обчислення барицентричних ко-
ординат забезпечує максимальну швидкодію [5]. Якщо ж системи, що
проектуються, не обмежені в часі обробки інформації, але критичні по точ-
ності і чутливості моделей, то ефективною є розроблена в цій статті регуля-
ризація на основі різного роду оптимальностей (O-оптимальність для точно-
сті, A(D)-оптимальності для чутливості).
Для оцінки ефективності представленої теорії наведено порівняння із
відомим класичним багаторядним методом групового врахування аргумен-
тів як еталоном в області прогнозування. Крім цього, представлена модифі-
кація МГВА з опорними поліноміальними функціями Без’є–Бернштейна, що
потребує більш детального дослідження. Перспективним напрямком є також
дослідження ГА і його збіжності для розглянутого класу задач.
A O
S D
Рис. 3. Розподіли базових контрольних точок: A, O, D — відповідні оптимальності;
S — нерегуляризований розподіл; X — область визначення нормованого входу
Регуляризація поліноміальних функцій Без’є–Бернштейна та її застосування в задачі ...
Системні дослідження та інформаційні технології, 2006, № 1 105
ЛІТЕРАТУРА
1. О’Квин Донни. Допечатная подготовка. Руководство дизайнера / Пер. с англ. —
М.: Издательский дом «Вильямс», 2002. — 592 с.
2. Harris C.J., Hong X., Gan Q. Adaptive modeling, estimation and fusion from data.
— Berlin:
3. Brown M., Harris C.J. Neurofuzzy adaptive modelling and control. — Hemel
Hempstead:
Springer, 2002. — 323 p.
4. Harris C.J., Hong X. Neurofuzzy network model construction using Bezier Bernstein
polynomial functions //
Prentice Hall, 1994. — 508 p.
5. Митник О.Ю., Бідюк П.І. Обернене відображення Кастельжо в нечітких ней-
ронних моделях // Системні дослідження та інформаційні технології. —
2004. — № 2. — С. 24–34.
IEE Proc. D Control Theory and Applications. — 2000.
— 147, № 3. — P. 337–343.
6. Chen S., Billings S.A., Luo W. Orthogonal least squares methods and their applica-
tion to non-linear system identification // Int. J. Control. — 1989. — 50, № 5. —
P.
7. Круг Г.К., Сосулин Ю.А., Фатуев В.А. Планирование эксперимента в задачах
идентификации и экстраполяции. — М.: Наука, 1977. — 207 с.
1873–1896.
8. Малютов М.Б., Заиграев А.Ю. Современные задачи оптимального планирования
регрессионных экспериментов. — Киев: Выща шк., 1989. — 64 с.
9. Hardin R.H., Sloane N. J. A. A new approach to the construction of optimal designs
// Journal of statistical planning and inference. — 1993. — 37. — P. 339–369.
10. Феллер В. Введение в теорию вероятностей и ее приложения. В 2-х т. — Т.1:
Пер. с англ. — М.: Мир, 1984. — 528 с.
11. Genetic algorithms can improve the construction of d-optimal experimental designs /
J. Poland, A. Mitterer, K. Knödler, A. Zell // Advances In Fuzzy Systems and
Evolutionary Computation. — 2001. — P. 227–231.
12. Бідюк П.І., Митник О.Ю. Застосування генетичного алгоритму в задачі
оцінювання вмісту хлорофілу в рослинності // Наук. вісті НТУУ «КПІ». —
2004. — № 4. — С. 65–70.
13. Rogers A., Prugel-Bennett A. Genetic Drift in Genetic Algorithm Selection Schemes
// IEEE Transactions on Evolutionary Computation. — 1999. — 3, № 4. —
P. 298–
14. Eiben A.E., Aarts E.H.L., Van Hee K.M. Global convergence of genetic algorithms: a
markov chain analysis. — Berlin: Springer, 1991. — P. 4–12.
303.
15. Ивахненко А.Г. Индуктивный метод самоорганизации сложных систем. — Ки-
ев: Наук. думка, 1981. — 296 с.
Надійшла 20.01.2005
РЕГУЛЯРИЗАЦІЯ ПОЛІНОМІАЛЬНИХ ФУНКЦІЙ БЕЗ’Є-БЕРНШТЕЙНА та ЇЇ ЗАСТОСУВАННЯ В ЗАДАЧІ ІДЕНТИФІКАЦІЇ НЕЛІНІЙНИХ СИСТЕМ
О.Ю. МИТНИК
ВСТУП
НЕЧІТКА ЛОГІКА В НЕЙРОННИХ СИСТЕМАХ
Висновок з теореми
ПОЛІНОМИ БЕРНШТЕЙНА ЯК ФУНКЦІЇ НАЛЕЖНОСТІ
ПОСТАНОВКА ЗАДАЧІ РЕГУЛЯРИЗАЦІЇ ОБЕРНЕНОГО ВІДОБРАЖЕННЯ КАСТЕЛЬЖО
ДЕЯКІ ОЦІНКИ ОПТИМАЛЬНОСТЕЙ
Оцінка I-оптимальності
Висновки з теореми
Оцінка A, D-оптимальності
ЗАСТОСУВАННЯ ГЕНЕТИЧНОГО АЛГОРИТМУ ДЛЯ ВИЗНАЧЕННЯ ОПТИМАЛЬНОГО РОЗПОДІЛУ БАЗОВИХ КОНТРОЛЬНИХ ТОЧОК
ПОЛІНОМІАЛЬНІ ФУНКЦІЇ БЕЗ’Є–БЕРНШТЕЙНА ЯК ЧАСТКОВІ ПРЕДСТАВЛЕННЯ
РЕЗУЛЬТАТИ МОДЕЛЮВАННЯ ТА ЇХ АНАЛІЗ
ВИСНОВКИ
Рис. 1. Оцінка поліномів Бернштейна 4-го порядку зверху: ;
Рис. 2. Оцінка сліду інформаційної матриці ( ): ; оцінка
Рис. 3. Розподіли базових контрольних точок: A, O, D — відповідні оптимальності; S — нерегуляризований розподіл; X — область визначення нормованого входу
|