Методи побудови регресійних моделей на основі нечітких даних

Запропоновано метод побудови регресійних моделей для систем на основі нечітких правил у випадку, коли реакція систем представлена нечіткими даними. Розроблено алгоритм, який з прийнятною точністю будує адекватну кількість правил Такагі-Сугено регресійної моделі з використанням автоматичної стратегії...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2015
Hauptverfasser: Єршов, С.В., Лико, Т.І.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Інститут кібернетики ім. В.М. Глушкова НАН України 2015
Schriftenreihe:Компьютерная математика
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/168359
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Методи побудови регресійних моделей на основі нечітких даних / С.В. Єршов, Т.І. Лико // Компьютерная математика. — 2015. — № 1. — С. 43-49. — Бібліогр.: 7 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-168359
record_format dspace
spelling irk-123456789-1683592020-05-01T01:28:51Z Методи побудови регресійних моделей на основі нечітких даних Єршов, С.В. Лико, Т.І. Инструментальные средства информационных технологий Запропоновано метод побудови регресійних моделей для систем на основі нечітких правил у випадку, коли реакція систем представлена нечіткими даними. Розроблено алгоритм, який з прийнятною точністю будує адекватну кількість правил Такагі-Сугено регресійної моделі з використанням автоматичної стратегії на основі даних спостережень, що надходять. Побудовано процедуру, що використовується для знаходження максимальної схожості параметрів регресійних моделей, у випадку, коли модель залежить від параметрів у консеквентах нечітких правил. Предложен метод построения регрессионных моделей для систем на основе нечетких правил, в ситуации, когда реакция систем представлена нечеткими данными. Разработан алгоритм, который с приемлемой точностью строит адекватное количество правил Такаги-Сугено регрессионной модели с использованием автоматической стратегии на основе поступающих данных наблюдений. Построена процедура, которая используется для нахождения максимального сходства параметров регрессионных моделей, в случае, когда модель зависит от параметров в консеквентах нечетких правил. A method for construction of regression models for systems based on fuzzy rules in situation, when reaction of a system is presented by fuzzy data, is proposed. An algorithm, which builds an adequate amount of Takagi-Sugeno rules for regression model with a reasonable accuracy and uses an automated strategy based on incoming data of observations, is developed. A procedure used for finding the maximum parameter similarity of regression models when the model depends on parameters in consequents of fuzzy rules, is constructed. 2015 Article Методи побудови регресійних моделей на основі нечітких даних / С.В. Єршов, Т.І. Лико // Компьютерная математика. — 2015. — № 1. — С. 43-49. — Бібліогр.: 7 назв. — укр. 2616-938Х http://dspace.nbuv.gov.ua/handle/123456789/168359 519.254 uk Компьютерная математика Інститут кібернетики ім. В.М. Глушкова НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Инструментальные средства информационных технологий
Инструментальные средства информационных технологий
spellingShingle Инструментальные средства информационных технологий
Инструментальные средства информационных технологий
Єршов, С.В.
Лико, Т.І.
Методи побудови регресійних моделей на основі нечітких даних
Компьютерная математика
description Запропоновано метод побудови регресійних моделей для систем на основі нечітких правил у випадку, коли реакція систем представлена нечіткими даними. Розроблено алгоритм, який з прийнятною точністю будує адекватну кількість правил Такагі-Сугено регресійної моделі з використанням автоматичної стратегії на основі даних спостережень, що надходять. Побудовано процедуру, що використовується для знаходження максимальної схожості параметрів регресійних моделей, у випадку, коли модель залежить від параметрів у консеквентах нечітких правил.
format Article
author Єршов, С.В.
Лико, Т.І.
author_facet Єршов, С.В.
Лико, Т.І.
author_sort Єршов, С.В.
title Методи побудови регресійних моделей на основі нечітких даних
title_short Методи побудови регресійних моделей на основі нечітких даних
title_full Методи побудови регресійних моделей на основі нечітких даних
title_fullStr Методи побудови регресійних моделей на основі нечітких даних
title_full_unstemmed Методи побудови регресійних моделей на основі нечітких даних
title_sort методи побудови регресійних моделей на основі нечітких даних
publisher Інститут кібернетики ім. В.М. Глушкова НАН України
publishDate 2015
topic_facet Инструментальные средства информационных технологий
url http://dspace.nbuv.gov.ua/handle/123456789/168359
citation_txt Методи побудови регресійних моделей на основі нечітких даних / С.В. Єршов, Т.І. Лико // Компьютерная математика. — 2015. — № 1. — С. 43-49. — Бібліогр.: 7 назв. — укр.
series Компьютерная математика
work_keys_str_mv AT êršovsv metodipobudoviregresíjnihmodelejnaosnovínečítkihdanih
AT likotí metodipobudoviregresíjnihmodelejnaosnovínečítkihdanih
first_indexed 2025-07-15T03:09:10Z
last_indexed 2025-07-15T03:09:10Z
_version_ 1837680769128988672
fulltext Компьютерная математика. 2015, № 1 43 Запропоновано метод побудови регресійних моделей для систем на основі нечітких правил у ви- падку, коли реакція систем пред- ставлена нечіткими даними. Роз- роблено алгоритм, який з прий- нятною точністю будує адекват- ну кількість правил Такагі-Сугено регресійної моделі з використан- ням автоматичної стратегії на основі даних спостережень, що надходять. Побудовано процеду- ру, що використовується для зна- ходження максимальної схожості параметрів регресійних моделей, у випадку, коли модель залежить від параметрів у консеквентах нечітких правил.  С.В. Єршов, Т.I. Лико, 2015 УДК 519.254 С.В. ЄРШОВ, Т.І. ЛИКО МЕТОДИ ПОБУДОВИ РЕГРЕСІЙНИХ МОДЕЛЕЙ НА ОСНОВІ НЕЧІТКИХ ДАНИХ В даний час велика увага приділяється мето- дам представлення моделей складних систем і процесів за допомогою нечіткої математи- ки. Такі моделі на сьогодні активно викорис- товуються в бізнесі, управлінні, економіці, для вирішення задач розробки програмного забезпечення, а також у багатьох інших сфе- рах, таких як охорона здоров’я та біологія. Однак, застосуванню нечіткої логіки для по- будови кореляцій між залежними і незалеж- ними змінними процесу, тобто регресійного моделювання, приділялося значно менше уваги. Нечіткі моделі, що задаються нечіткими правилами Такагі-Сугно або Мамдані [1], є ефективним засобом, який використовується для апроксимації поведінки нелінійних сис- тем та процесів. Ситуація ускладнюється че- рез те, що у багатьох реальних моделях, має бути врахована нечіткість даних, на основі яких вони побудовані. Така нечіткість може виникати через обмежену точність вимірю- вальних пристроїв, неповноту і недовизначе- ність опису об’єктів даних. Існує дві основні проблеми, які заважають побудувати нечіткі регресійні моделі на ос- нові правил у випадку нечітких даних. Пер- ша проблема – яким чином визначити нечіткі множини антецедентів правил, що ґрунту- ються на нечітких даних. Друга проблема, яка вирішена в даній роботі – в тому, як ви- значити лінійні функції у консеквентах пра- вил, якщо спостереження виходу представ- лені нечіткими даними. С.В. ЄРШОВ, Т.І. ЛИКО Компьютерная математика. 2015, № 144 Мета даної роботи – побудова систематичного методу для розробки нечіт- ких регресійних моделей, що ґрунтуються на правилах, у випадку нечітких да- них. Дана робота являє собою подальший розвиток досліджень у напрямку ста- новлення адаптивних моделей та архітектур інтелектуальних мультиагентних систем у нечіткому представленні [2 – 4]. Нечіткий регресійний аналіз є нечітким типом класичного регресійого ана- лізу, використовується для оцінки функціональних відношень між залежними і незалежними змінними в нечіткому середовищі. У всіх випадках нечіткої регре- сії, лінійна регресія рекомендується для практичних ситуацій, коли рішення час- то мають бути зроблені на основі неточних, неповних даних. Існує багато під- ходів для вирішення таких задач. Модель нечіткої регресії вперше розроблена Танакою [5] у вигляді лінійної системи. Танака та інші спочатку застосовували нечітку процедуру лінійної регресії для чітких експериментальних даних. У по- дальших роботах використовувались нечіткі дані на вході для побудови нечіткої регресійної моделі. Нечіткі вхідні дані, що використовувались у цих експе- риментах, представлені у вигляді трикутних нечітких чисел [6]. Метод най- менших квадратів для нечітких змінних, що запропонований Даймондом [7], дає рішення аналога нормального рівняння класичних найменших квадратів. Задачею регресійного аналізу є знаходження функціональних відношень між незалежними змінними 1 2[ , ,..., ]nx x x x та залежними змінними 1 2[ , ,..., ]ny y y y , де n – кількість незалежних змінних, а m – кількість залежних змінних. Регресійна модель виражається в цьому випадку так: ( ) ,y f x   (1) де 1 2( ) [ ( ), ( ),..., ( )],mf x f x f x f x а 1 2[ , ,..., ]m     – вектор випадкових помилок функціонального наближення. Для спрощення такої моделі припускається, що залежність між залежними і незалежними змінними є лінійною. Таким чином задача спрощується до знаходження параметрів лінійної функції. Окрім того для кожної залежної змінної будується окрема регресійна модель. В найпростішому випадку для одної незалежної змінної: 0 1 .y a a x    (2) Для багатьох змінних: 0 1 1 ... .m my a a x a x      (3) Для узагальнення цієї моделі в нечіткому середовищі використовується сімейство нечітких множин, що називається нечіткими числами [1]. Нечітка підмножина A множини цілих чисел R з функцією належності ]1,0[R:  називається нечітким числом, якщо (і) A – нормальна, тобто існує такий елемент 0a , що 1)a( 0A  ; (ii) A – нечітка випукла множина, тобто 1 2 1 2, ( (1 ) )Aa a R a a        1 2( ) ( ), [0,1];A Aa a    (iii) A – кусково-неперервна функція; МЕТОДИ ПОБУДОВИ РЕГРЕСІЙНИХ МОДЕЛЕЙ НА ОСНОВІ … Компьютерная математика. 2015, № 1 45 (iv) }0)a(:Ra{)Asup( A  є обмеженим. Нечітке число може бути представлене сімейством множин, що називаються  -зрізами: { : ( ) }.AA a R a      (4) Тоді нечітке число А можна представити, як об’єднання множин  -зрізами: [0,1] .A A    З визначення нечіткого числа легко бачити, що кожен  -зріз нечіткого числа А – закритий інтервал [ ( ), ( )],L UA A A    де ( ) inf{ : ( ) },L AA a R a      (5) ( ) sup{ : ( ) }.U AA a R a      (6) Звідси, для двох нечітких чисел A і B з  -зрізами [ ( ), ( )],U UA A A    [ ( ), ( )],U UB B B    можна визначити відстань між A і B: 1 1 2 2 0 0 ( , ) ( ( ) ( )) ( ( ) ( )) .L L U Ud A B A B da A B da         (7) Тоді для простої нечіткої регресії 0 1Y b b X  параметри 0 1,b b R можна оцінити, мінімізуючи відстань між спостережуваними даними та даними, отри- маними з оцінки моделі. 2 0 1 0 1 1 min ( , ) ( , ). k i i i H b b d Y b b X    (8) Знайти розв’язок такої задачі для простої нечіткої регресії можна аналі- тично. Однак, варто відмітити, що вигляд функції ()H залежить від знаку параметра 1.b 1 1 2 2 0 1 0 1 0 1 1 0 0 ( , ) ( ( ) ( )) ( ( ) ( )) . k L L U U i i i i i H b b Y b b X d Y b b X d              (9) 1 1 2 2 0 1 0 1 0 1 1 0 0 ( , ) ( ( ) ( )) ( ( ) ( )) . k L U U L i i i i i H b b Y b b X d Y b b X d              (10) Рівність (9) дійсна для 1 0,b  а (10) – в іншому випадку. З цих нерівностей можна легко знайти розв’язки для випадку однієї неза- лежної змінної, однак для багатьох змінних складність задачі виростає експо- ненціально. Однак на основі цих обчислень можна адаптувати метод градієнтно- го спуску для ітеративного вирішення задачі, що значно збільшить ефективність для регресії з багатьма змінними. Алгоритм методу градієнтного спуску для однієї змінної містить такі кроки: 1) ініціалізація початкових значень моделі 0 0 0 1, ;b b 2) початок ітерації i = 1; С.В. ЄРШОВ, Т.І. ЛИКО Компьютерная математика. 2015, № 146 3) оцінити функцію H з відповідними параметрами; 4) оновити параметри 0 1 0 0 0 ( , )H b bb b      і 0 1 1 0 1 ( , )H b bb b      або 0 1 0 0 0 ( , )H b bb b      і 0 1 1 0 1 ( , ) ;H b bb b      5) оновити оцінку параметрів 1 0 0 0 i ib b b   та 1 1 1 1; i ib b b   6) якщо 0b   або 1 ,b   то 1і і  і продовжити з п. 3, інакше зупинка. Нехай 1 2[ , ,..., ]T pu u u u – вектор вхідних змінних, а х – вихідна змінна. Нечітка модель (типу Такагі-Cугено) складається з набору нечітких правил IF-THEN, що мають такий вигляд: Rk: IF u1= 1kA І … І up= kpA THEN 0 1 1 2 2 ... ,k k k k kp px b b u b u b u     де k = 1,…, M, kx – це вихід k-го правила, 1 2[ , ,..., ]T k k k kpb b b b – коефіцієнти в k-му правилі, kjA (j = 1,2,..., р) – нечіткі множини антецедента правила. Врахо- вуючи довільнe введення даних 1 2[ , ,..., ] ,T i i i ipu u u u кожне правило забезпечує прогнозований вихід. Агрегований вихід нечіткої моделі Tакагі-Сугено об- числюється таким чином: 1 1 / ,M Mk k k i i i ik k x x x       (11) де k i – сила «спрацювання» правила kR для i-го входу. Розглянемо стратегію ідентифікації антецеденту нечіткої моделі, при якому спостереження в наступному вигляді: { ( , ), 1,..., },i i i iT e e u x i n   де ix – неточно спостережувані значення для виходу х. Початкове нечітке правило генерується за допомогою простого способу. Нечітких множини kjA  в антецеденті початкового нечіткого правила визнача- ються наступним чином: 1j 1 1 , n ij i v u n    2 1j 1 1 1 ( ) , 1 n ij j i s u v n      де kjv і kjs (к = 1,…, М, j = 1,…, р) представляють відповідно центр і ширину в правилі. При цьому консеквент правила ідентифікується з використанням алгоритму, який описаний далі. Будується нове правило і додається до вихідної бази правил. Вектор, що має найгірше значення ,fM позначається iu та розглядається як центр цього нового правила: МЕТОДИ ПОБУДОВИ РЕГРЕСІЙНИХ МОДЕЛЕЙ НА ОСНОВІ … Компьютерная математика. 2015, № 1 47 2 1 1 ( ) , n f i i i M E x x n     де ( ) ( ) i X i xE x d        – очікувана схожість, що пов’язана з .ix Нечіткі антецеденти ,нов jA нового згенерованого правила будуть характери- зуватися значеннями , ,н о в jv , ,нов js які визначаються наступним чином: , , , 1,..., ,нов j i jv u j p  2 2 2 , , , , ,1 1 / .n n нов j i i i j нов j i ii i s u v        Нарешті, коли нове нечітке правило додається до бази правил, номер правила, збільшується, тобто M = M + 1, і маємо , , ,M j нов jv v , , .M j нов js s Перетворимо узагальнений консеквент (11) у наступний векторний або матричний вигляд , 1,..., ,T i ix h b i n  або ,Tx H b де h, Н і В визначаються відповідно наступним чином: 1 1 1 1 1[ , ,..., ..., , ,..., ],M M M i i i i i ip i i i i iph w w u w u w w u w u 1 2[ , ,..., ],nH h h h 1 2[ , ,..., ] ,T T T T nb b b b де k iw – це вага і-го значення даних в k-му правилі, що визначається як 1 / .Mk k j i i ij w     Можна припустити, що кожен компонент ix повного вектора даних х – реалізація нормальної випадкової змінної iX із середнім T ih b і стандартним відхиленням . При такому припущенні, повний вектор параметрів містить компоненти ( , ),Tb   які мають бути визначені у випадку, коли тільки ix можна спостерігати. Функція щільності ймовірності від X позначається ( , ),g x  де 1 2[ , ,..., ]T d     є вектор-стовпець невідомих параметрів у просторі парамет- рів . Алгоритмом підходить до проблеми максимізації ймовірності даних, що спостерігаються, ( , ),L x обробляючи ітераційно ймовірність повних даних ( , ) ( , ).L x g x   Кожна ітерація алгоритму складається з двох етапів, що нази- ваються крок визначення очікування і крок максимізації. Крок визначення поля- гає в обчисленні ( ) ( ) ( ) log( ( , )) ( , ) ( , ) , ( , ) q xq q L x g x dx Q L x           де очікування log ( , )L x береться щодо умовної щільності х при x , використо- вуючи вектор ( ).q Другий крок вимагає максимізації ( )( , )qQ   щодо  за простором параметрів  . Алгоритм поперемінно повторює С.В. ЄРШОВ, Т.І. ЛИКО Компьютерная математика. 2015, № 148 вищевказані кроки, поки збільшення ймовірності даних, що спостерігаються, не стає менше деякого порога. При цьому функція щільності ймовірності повних даних задана як 2 2 1 1 ( )( , ) exp . 22 Tn i i i x h bg x             Необхідно знайти максимум ( )( , )qQ   по . Це може бути досягнуто шляхом диференціювання ( )( , )qQ   по b і σ, відповідно, що призводить до:   ( ) ( ) 2 ( , ) 1 , q q TQ H HH b b           ( ) ( ) (q) 3 1 ( , ) 1 2 H . q n q T T T i i Q n b b HH b                   Прирівнюючи ці похідні нулю, отримуємо наступні значення для b і σ: ( 1) 1( ) ,q Tb H H H    ( 1) ( ) ( 1) (q) ( 1) ( 1) 1 1 2 H . n q q T q T q T q i i b b HH b n                 Коли ітерації закінчуються, можна отримати коефіцієнти регресії b і, таким чином, отримати моделі множинної регресії з чіткими входами і нечіткими виходами. Висновки. Таким чином, у даній роботі запропоновано метод побудови ре- гресійних моделей для систем на основі нечітких правил, коли реакція систем представлена нечіткими даними. Розроблено алгоритм, який з прийнятною точ- ністю будує адекватну кількість правил Такагі-Сугено регресійної моделі з ви- користанням автоматичної стратегії на основі даних спостережень, що надхо- дять. Побудовано процедуру, що використовується для знаходження максима- льної схожості параметрів регресійних моделей, у випадку, коли модель зале- жить від параметрів у консеквентах нечітких правил. С.В. Ершов, Т.И. Лыко МЕТОДЫ ПОСТРОЕНИЯ РЕГРЕССИОННЫХ МОДЕЛЕЙ НА ОСНОВЕ НЕЧЕТКИХ ДАННЫХ Предложен метод построения регрессионных моделей для систем на основе нечетких правил, в ситуации, когда реакция систем представлена нечеткими данными. Разработан алгоритм, который с приемлемой точностью строит адекватное количество правил Такаги-Сугено регрессионной модели с использованием автоматической стратегии на основе поступающих данных наблюдений. Построена процедура, которая используется для нахождения макси- мального сходства параметров регрессионных моделей, в случае, когда модель зависит от параметров в консеквентах нечетких правил. МЕТОДИ ПОБУДОВИ РЕГРЕСІЙНИХ МОДЕЛЕЙ НА ОСНОВІ … Компьютерная математика. 2015, № 1 49 S.V. Yershov, T.I. Lyko METHODS FOR CONSTRUCTION OF REGRESSION MODELS BASED ON FUZZY DATA A method for construction of regression models for systems based on fuzzy rules in situation, when reaction of a system is presented by fuzzy data, is proposed. An algorithm, which builds an adequate amount of Takagi-Sugeno rules for regression model with a reasonable accuracy and uses an auto- mated strategy based on incoming data of observations, is developed. A procedure used for finding the maximum parameter similarity of regression models when the model depends on parameters in consequents of fuzzy rules, is constructed. 1. Рутковская Д., Пилиньский М., Рутковский Л. Нейронные сети, генетические алгоритмы и нечеткие системы. – М.: Горячая линия – Телеком, 2004. – 452 с. 2. Ершов С.В. Модель интеллектуальных агентов, основанная на нечеткой логике высшего типа // Компьютерная математика. – 2012. – № 1. – C. 10 – 16. 3. Ершов С.В. Трансформационный подход к разработке адаптивных интеллектуальных агентов на основе нечетких схем переходов // Там же. – 2011. – № 1. – C. 69 – 78. 4. Ершов С.В. Принципы построения нечетких мультиагентных систем в распределенной среде // Там же. – 2009. – № 2. – C. 54 – 61. 5. Tanaka H., Uejima S., Asia K. Fuzzy linear regression analysis with fuzzy model // IEEE Transactions on Systems, Man and Cybernetics. – 1982. – N 12. – P. 903 – 907. 6. Dubois D., Prade H. Fuzzy Sets and Systems: Theory and Applications. – New York: Aca- demic Press, 1980. – 392 p. 7. Diamond P. Fuzzy least squares // Information Sciences. – 1988. – N 46. – P. 141 – 157. Одержано 27.01.2015 Об авторах: Єршов Сергій Володимирович, доктор фізико-математичних наук, завідувач відділу Інституту кібернетики імені В.М. Глушкова НАН України, E-mail: sershv@ukr.net Лико Тетяна Іванівна, аспірантка Інституту кібернетики імені В.М. Глушкова НАН України. E-mail: lykotan@gmail.com