Методика вибору математичної моделі екологічного процесу

У ХХІ ст. пошук підходів до вирішення екологічних проблем зумовлений загрозами існування навколишнього середовища внаслідок провадження різноманітних видів діяльності та бездіяльності людини. Більшу половину земної поверхні змінено людиною. Ця модифікація називається зміною в землекористуванні. Нелі...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2017
1. Verfasser: Мікулін, В.В.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2017
Schriftenreihe:Системні дослідження та інформаційні технології
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/151167
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Методика вибору математичної моделі екологічного процесу / В.В. Мікулін // Системні дослідження та інформаційні технології. — 2017. — № 2. — С. 115-129. — Бібліогр.: 10 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-151167
record_format dspace
spelling irk-123456789-1511672019-04-27T01:25:12Z Методика вибору математичної моделі екологічного процесу Мікулін, В.В. Методи аналізу та управління системами в умовах ризику і невизначеності У ХХІ ст. пошук підходів до вирішення екологічних проблем зумовлений загрозами існування навколишнього середовища внаслідок провадження різноманітних видів діяльності та бездіяльності людини. Більшу половину земної поверхні змінено людиною. Ця модифікація називається зміною в землекористуванні. Нелінійності у змінах у землекористуванні можна вивчати за допомогою інструментів інтелектуального аналізу даних. Запропоновано розглядати більш детально три моделі для зміни землекористування: штучні нейронні мережі, методи класифікації і регресії за допомогою побудови дерева рішень і багатовимірні адаптивні регресійні сплайни. Порівнюються результати трьох інструментів інтелектуального аналізу даних. В XXI ст. поиск подходов к решению экологических проблем обусловлен угрозами существования окружающей среды в результате осуществления различных видов деятельности и бездеятельности человека. Более половины земной поверхности изменено человеком. Эта модификация называется изменением в землепользовании. Нелинейности в изменениях в землепользовании можно изучать с помощью инструментов интеллектуального анализа данных. Предложено рассматривать более подробно три модели для изменений землепользования: искусственные нейронные сети, методы классификации и регрессии с помощью построения дерева решений и многомерные адаптивные регрессионные сплайны. Сравниваются результаты трех инструментов интеллектуального анализа данных. In the twenty-first century, the search for approaches to solving environmental problems is caused by the threat to the environment as a result of a variety of human activities, or lack thereof. More than half of the Earth's surface has been altered by people. This modification is called the change of land use. The nonlinearities in changes of land use can be studied with the help of data mining tools. It is proposed to consider the three models for the change of land use: artificial neural networks, methods for solving problems of classification and regression method of building decision trees, and multidimensional adaptive regression splines. Further studies compared the results of three data mining tools. 2017 Article Методика вибору математичної моделі екологічного процесу / В.В. Мікулін // Системні дослідження та інформаційні технології. — 2017. — № 2. — С. 115-129. — Бібліогр.: 10 назв. — укр. 1681–6048 DOI: https://doi.org/10.20535/SRIT.2308-8893.2017.2.11 http://dspace.nbuv.gov.ua/handle/123456789/151167 519.226 uk Системні дослідження та інформаційні технології Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Методи аналізу та управління системами в умовах ризику і невизначеності
Методи аналізу та управління системами в умовах ризику і невизначеності
spellingShingle Методи аналізу та управління системами в умовах ризику і невизначеності
Методи аналізу та управління системами в умовах ризику і невизначеності
Мікулін, В.В.
Методика вибору математичної моделі екологічного процесу
Системні дослідження та інформаційні технології
description У ХХІ ст. пошук підходів до вирішення екологічних проблем зумовлений загрозами існування навколишнього середовища внаслідок провадження різноманітних видів діяльності та бездіяльності людини. Більшу половину земної поверхні змінено людиною. Ця модифікація називається зміною в землекористуванні. Нелінійності у змінах у землекористуванні можна вивчати за допомогою інструментів інтелектуального аналізу даних. Запропоновано розглядати більш детально три моделі для зміни землекористування: штучні нейронні мережі, методи класифікації і регресії за допомогою побудови дерева рішень і багатовимірні адаптивні регресійні сплайни. Порівнюються результати трьох інструментів інтелектуального аналізу даних.
format Article
author Мікулін, В.В.
author_facet Мікулін, В.В.
author_sort Мікулін, В.В.
title Методика вибору математичної моделі екологічного процесу
title_short Методика вибору математичної моделі екологічного процесу
title_full Методика вибору математичної моделі екологічного процесу
title_fullStr Методика вибору математичної моделі екологічного процесу
title_full_unstemmed Методика вибору математичної моделі екологічного процесу
title_sort методика вибору математичної моделі екологічного процесу
publisher Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
publishDate 2017
topic_facet Методи аналізу та управління системами в умовах ризику і невизначеності
url http://dspace.nbuv.gov.ua/handle/123456789/151167
citation_txt Методика вибору математичної моделі екологічного процесу / В.В. Мікулін // Системні дослідження та інформаційні технології. — 2017. — № 2. — С. 115-129. — Бібліогр.: 10 назв. — укр.
series Системні дослідження та інформаційні технології
work_keys_str_mv AT míkulínvv metodikaviborumatematičnoímodelíekologíčnogoprocesu
first_indexed 2025-07-13T01:08:07Z
last_indexed 2025-07-13T01:08:07Z
_version_ 1837491971060400128
fulltext  В.В. Мікулін, 2017 Системні дослідження та інформаційні технології, 2017, № 2 115 TIДC МЕТОДИ АНАЛІЗУ ТА УПРАВЛІННЯ СИСТЕМАМИ В УМОВАХ РИЗИКУ І НЕВИЗНАЧЕНОСТІ УДК 519.226 DOI: 10.20535/SRIT.2308-8893.2017.2.11 МЕТОДИКА ВИБОРУ МАТЕМАТИЧНОЇ МОДЕЛІ ЕКОЛОГІЧНОГО ПРОЦЕСУ В.В. МІКУЛІН Анотація.У ХХІ ст. пошук підходів до вирішення екологічних проблем зумов- лений загрозами існування навколишнього середовища внаслідок провадження різноманітних видів діяльності та бездіяльності людини. Більшу половину зем- ної поверхні змінено людиною. Ця модифікація називається зміною в землеко- ристуванні. Нелінійності у змінах у землекористуванні можна вивчати за до- помогою інструментів інтелектуального аналізу даних. Запропоновано розглядати більш детально три моделі для зміни землекористування: штучні нейронні мережі, методи класифікації і регресії за допомогою побудови дерева рішень і багатовимірні адаптивні регресійні сплайни. Порівнюються результа- ти трьох інструментів інтелектуального аналізу даних. Ключові слова: множинна класифікація, штучні нейронні мережі, багатови- мірні адаптивні регресійні сплайни, множинна детермінація, оцінка правдопо- дібності, комірка, зміни у землекористуванні. ВСТУП В Україні дедалі більш актуальною проблемою стає охорона навколишнього середовища. Показники екологічного стану в Україні наближаються до кри- тичних значень за результатам аудита ООН. Для України екологічна безпека стає одним із перших пріоритетів формування національної політики. Одні- єю з необхідних умов сучасності в Україні є реконструкція людської і гос- подарської діяльності з урахуванням екологічних факторів. Тільки за допо- могою екологічного аналізу ситуації діючих об’єктів діяльності та об’єктів, які перебувають на стадії проектування, можна досягти позитивних змін. Актуальність цієї теми зумовлено загрозами існування навколишнього сере- довища внаслідок провадження різноманітних видів діяльності та бездіяль- ності людини. Натепер у галузі промисловості екологія розглядається як важливий ас- пект майже всіх нових проектів розвитку виробництва. Розвиток екологіч- ного менеджменту як наукового напряму спонукає до збільшення кількості методів і прийомів, які можуть бути застосовані як інструменти для поліп- шення екологічних параметрів кожного виробничого процесу. У сучасному підході до удосконалення технологічних процесів для контролю екологічних параметрів дедалі частіше використовують матема- В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 116 тичні методи прогнозування. Актуальність розроблення таких методів поля- гає у передбаченні поведінки екологічних параметрів технологічних проце- сів з метою прогнозування потенційної небезпеки впровадження технологій на виробництві. З огляду на потенційні екологічні наслідки зміни клімату основне за- вдання сьогодення — оцінювання динамічних ефектів зовнішнього впливу клімату на флуктуацію. Це не є тривіальним завданням, оскільки клімат мо- же взаємодіяти з іншими факторами, такими, як густота населення, ступінь міжвидової конкуренції, вплив випасу і людського ставлення до фізичного забруднення навколишнього середовища. Хоча відносна значущість внутрі- шніх факторів і змін зовнішнього навколишнього середовища у визначенні динаміки популяцій тварин уже давно є центральною темою в екології, ін- терактивний вплив клімату і густота населення, як правило, ігноруються. Взаємодія між кліматом та іншими факторами може призвести до появи складної динаміки, що не належним чином моделюється лінійними систе- мами. Виконано огляд відомих робіт із цієї тематики. Сьогодні існує декіль- ка типів моделей, які успішно використовуються в прогнозуванні екологіч- них процесів. Одним з інструментів, які можуть бути використані для цієї мети, є штучні нейронні мережі (ШНМ) [1]. Як об’єкт моделювання за допомогою ШНМ був викид газоподібного діоксиду сірки, постійний моніторинг якого проводився у місті Бор (Сербія). Крім того, для процедури моделювання ви- користовувалися метеорологічні параметри: сезон, швидкість вітру, напря- мок вітру, температура повітря, вологість і атмосферний тиск. Ці дослідження дали змогу сформувати математичну модель, яка дозво- лить прогнозувати надмірну емісію діоксиду сірки з достатньою точністю, на підставі записаних метеорологічних і технологічних параметрів, отрима- них з виробництва, зокрема мідеплавильного комплексу. Ця модель не може бути використана для поліпшення технологічного процесу, однак вона при- датна для непрямого захисту від впливу на громадян підвищеного вмісту діоксиду сірки в повітрі. Описана математична модель ґрунтується на прогнозуванні динаміки метеорологічних і технологічних параметрів, випливає з плану виробництва мідеплавильного комплексу і може бути використана для прогнозування потенційного надмірного викиду діоксиду сірки в повітрі. Таким чином, за ті дні року, коли передбачається надлишкова емісія, можна скоригувати план виробництва, у тому числі щодо зменшення кількості концентрату, що підлягає обробленню та збільшенню виробництва сірчаної кислоти. Ці по- правки можуть бути виконані ітеративно до передбаченого вмісту діоксиду сірки, що не знижується менше від його граничного значення. Користувачі таких моделей прагнуть отримати якомога точніших прогнозів і дедалі частіше потребують формальних оцінок невизначеності в модельних прогнозах для обґрунтованого прийняття рішень та управління ризиками. Одним із нетривіальних інструментів нелінійного моделювання є байєсівські методи формування логічного висновку. Такий підхід запропо- новано до розроблення моделі стохастичного процесу, у якому екофізіологіч- ні властивості планктонних груповань виражені авторегресійними випадко- Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 117 вими процесами [2]. Цей підхід відображає вплив змін у планктонних гру- пованнях з плином часу і застосовується до тематичного дослідження в океані на станції Папа з використанням методу Монте-Карло для ланцюгів Маркова. Отримані результати свідчать про те, що, спираючись на об’єктивну попередню ретроспективу, можна виокремити корисну інформа- цію про стан моделі та підмножини параметрів, і навіть зробити корисні дов- гострокові прогнози на підставі рідкісних і зашумлених спостережень. Формулювання байєсівської моделі дасть змогу інтегрувати вимірю- вання за допомогою стандартних спостережень змінних стану в межах по- слідовної і строгої структури логічного висновку. Для множинної класифікації використовують методи класифікації і ре- гресії за допомогою регресійного дерева рішень (РДР) і багатовимірних ада- птивних регресійних сплайнів (БАРС), які свідчать про їх широке застосу- вання для моделювання складних екологічних процесів. Насамперед ці моделі потрібні для того, щоб переконатися, що правила зупинення не зава- жають моделі вилучати правильні дані в ході тренувального прогону. Отже, модель спрощується через зменшення складності моделі і видалення розри- вів моделі, які не роблять її більш точною. Також для множинної класифіка- ції використовується модель трансформації землекористування, яка має дві особливості на відміну від початкової структури. По-перше, змінено почат- кову структуру моделі ШНМ, яка використовується у підходах до змін у землекористуванні для бінарної класифікації, де кількість вузлів у вихідно- му шарі відповідає кількості бажаних результатів. По-друге, використано стратегію кодування «один за класом» для вихідного шару, який містить комбінацію k-двійкових чисел для подання атрибутів до категорії, кожна з яких пов’язана з одним із переходів. Щоб визначити робочий стан переходу для кожного класу землекористування, тільки один з k чисел у вихідному шарі має бути кодований як один, а решта k чисел дорівнюють нулю. Усі вузли у вихідному шарі кодуються як нуль, якщо використання землі збері- гається між двома кроками. Модель множинної класифікації у змінах у зем- лекористуванні дозволяє користувачу визначити входи, приховані блоки і вихідні блоки. Мета роботи — вибір із трьох математичних моделей (ШНМ, РДР, БАРС) кращої. Одна із запропонованих моделей ґрунтується на формально- му і неформальному виборі моделі у випадку неповноти вхідних даних. Друга обрана модель прийнятна до оцінювання моделей і ґрунтується на байєсовських критеріях вибору моделі, що показують задовільні результати за відомого розподілу помилок унаслідок моделювання процесів. Третя мо- дель оцінювання екологічних процесів — дедуктивне моделювання (від зага- льного до часткового) математичного сподівання, дисперсії та густонаселе- ності, яке використовувалося в автоматизованому оцінюванні фінансових процесів. ПОСТАНОВКА ЗАВДАННЯ Розробити методику побудови математичної моделі та її апробації на фак- тичних даних стосовно екологічних процесів. За допомогою обраних трьох В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 118 математичних моделей (ШНМ, РДР, БАРС) проаналізувати та дослідити розглянутий підхід до моделювання екологічних процесів. МЕТОДИКА ПОБУДОВИ МОДЕЛІ ЕКОЛОГІЧНОГО ПРОЦЕСУ Виділимо етапи побудови моделі екологічного процесу:1) аналіз досліджу- ваних процесів; 2) підготовку даних для побудови моделі (нормування, за- повнення пропусків, екстремальні значення, фільтрацію); 3) оцінювання структури і параметрів моделі; 4) аналіз адекватності моделі. Аналіз досліджуваного процесу — це фундаментальний етап побудо- ви моделей різних процесів. Для його виконання дослідник повинен мати реальний досвід практичної побудови процесів різної природи. Етап аналізу процесу полягає у виконанні таких завдань [6, 7, 8]: а) визначення розмірності (кількості входів і виходів) моделі процесу; б) визначення логічних зв’язків між змінними досліджуваного процесу та аналіз можливості і ̈х математичного опису; в) визначення кількості зовнішніх збурень та і ̈х типу (детерміноване чи стохастичне); г) установлення потенційної можливості виділення окремих підпроце- сів (декомпозиція), які є простішими як у функціонуванні, так і у матема- тичному описі. Однак такий процес розподілу є досить складним, виконання якого потребує застосування спеціальних математичних методів; д) визначення функції рівнів і типів зв’язків між ними у випадку ієрар- хічної структури досліджуваного процесу. У технологічних процесах раціо- нально будувати дерево ієрархії, що дозволить поділити процес на два і більше рівнів функціонування і керування; е) використання бази знань, нагромадженої за рахунок наукових дослі- джень та їх результатів щодо особливостей життєвого циклу процесу, а та- кож застосування напрацьованих законів і закономірностей цього процесу, виявлення досвіду теоретичного чи експериментального дослідження; ж) визначення переваг, недоліків, можливостей подальшого удоскона- лення досліджуваного процесу за наявності розроблених моделей. Викори- стання робочих моделей дозволить оптимізувати процес побудови і застосу- вання моделі. Підготовка даних для побудови моделі Метою підготовки експериментальних даних для побудови моделі є зведен- ня даних до зручної форми для визначення закономірностей у досліджува- них процесах. У прикладному сенсі оброблення даних спрямовано на вияв- лення відмінності між відповідними показниками та оцінювання достовірності такої відмінності. Оскільки дані фактично є випадковими ве- личинами, у процесі дослідження може виникнути недостовірний результат моделювання процесу, тобто різний результат за однакових вхідних умов. Процес попереднього оброблення експериментальних даних включає: а) нормування — логарифмування даних або зведення до зручного діапазо- ну їх зміни; б) коригування даних — заповнення пропусків та зменшення екстремальних значень, яких явно немає в основному інтервалі значень Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 119 змінних; в) формування перших або різниць вищих порядків, необхідних для аналізу відповідних складових часового ряду. Оцінювання структури і параметрів моделі На цьому етапі оцінюються коефіцієнти (параметри) та структури моделі [7, 8]. Параметри узагальненої лінійної моделі в основному оцінюються за допомогою методу найменших квадратів (МНК) з використанням принципу економії або збереження. Цей принцип обмежує використання кількості ко- ефіцієнтів для їх оцінювання, що не перевищує їх необхідної кількості. Така кількість формується на основі потреби у збереженні статистичних характе- ристик процесу. Найпоширенішими методами оцінювання параметрів моделі є такі: МНК; метод максимальної правдоподібності (ММП); метод допоміжної (інструментальної) змінної (МДП); нелінійний метод найменших квадратів (НМНК) та їх рекурсивні версії (РМНК, РММП, РМДП). Для отримання не- зміщених, консистентних та ефективних оцінок вектора параметрів  ліній- ної регресійної математичної моделі, наприклад, моделі змішаної регресії )()()()2()1()( 21210 kkzbkxbkyakyaaky  , за допомогою МНК необхідно задовольнити такі умови: )(k — некорельо- вана послідовність випадкових чисел з нульовим середнім; ,0)]([  kE             jk jk jkEk ,0 , )]()([)]([cov 2 , тобто послідовності )(k і )(ky не повинні бути корельовані між собою. Зазначимо, що перевірити виконання наведених умов можна тільки після оцінювання коефіцієнтів моделі, а до оцінювання можна лише постулювати їх виконання [9]. Діагностика моделі На цьому етапі оцінюється адекватність процесу моделювання шляхом пе- ревірки оцінених кандидатів. Аналіз ґрунтується на оцінюванні таких пара- метрів: 1. Коефіцієнт множинної детермінації ,2R який обчислюється таким чином: ' 2 1 )(var )~(var SST SSE y y R  , де )~(var y — дисперсія залежної змінної, оціненої за допомогою побудова- ної моделі; )(var y — дисперсія вимірів залежної змінної; SSE    N k kyky 1 2)](~)([ — сума квадратів похибок (залишків) моделі (sum of squared errors);    N k ykySST 1 2])([ — загальна сума квадратів (total sum of squares); y — середнє значення; SSRSSESST  , де    N k ykySSR 1 2])(~[ В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 120 — загальна сума квадратів для регресії (sum of squares for regresion). Най- кращим значенням є 12 R , тобто коли дисперсії вимірів змінної та цієї ж змінної, оціненої за рівнянням, збігаються [9]. 2. Сума квадратів похибок для вибраної моделі повинна бути мініма- льною, тобто      N k N k ykykyke 1 1 22 )~(min))()(~()( порівняно з усіма ін- шими моделями [9]. 3. Похибки моделі не повинні бути корельовані між собою. Корельова- ність похибок визначають за статистикою Дарбіна–Уотсона ,DW яка розра- ховується за формулою  22DW , де 2/)]1()([ ekekeE  — коефіці- єнт кореляції між сусідніми в часі значеннями похибки; 2 e — дисперсія послідовності похибок )}({ ke . Таким чином, за повної відсутності кореляції між похибками 2DW — це ідеальне значення. Граничними значеннями для DW є 0 (якщо 1 ) і 4 (якщо 1 ) [9]. Приклад побудови математичних моделей екологічного процесу Зміни у землекористуванні являють собою складний процес і моделювання цих систем є теж досить складним. Добре відомо, що чинники впливу на зміни у землекористуванні працюють у різних просторово-часових масшта- бах нелінійним чином і, отже, для моделювання цієї динаміки потрібні нелі- нійні інструменти. Нелінійні методи часто застосовуються у моделюванні навколишнього середовища, такі як ШНМ, що набули поширення протягом останніх двох десятиліть. Багатовимірні адаптивні регресійні сплайни і РДР теж відомі моделі, зокрема РДР обчислює ймовірність результатів з викори- станням декількох просторових збудників, щоб показати монотонні резуль- тати; БАРС долає обмеження кусково-постійних функцій у РДР, генеруючи кусково-лінійні моделі з використанням базисних функцій. Однією з проблем моделювання є те, що в межах обраного регіону від- бувається кілька змін у землекористуванні. Це характерно для деяких регіо- нів, де міські ліси будуть перетворені із земель сільського господарства, у той час, як сусідні перетворюються в сільськогосподарські. Проте деякі до- слідники розглядали кілька переходів у землекористуванні в одній і тій же моделі і таким чином спрощували процес зміни у землекористуванні. Під час моделювання або імітації більш ніж один результат часто створює про- блему МК. Кілька підходів були розроблені протягом останніх трьох деся- тиліть для імітації змін у землекористуванні, використовуючи численні змінні навколишнього середовища. Однак більшість з них обмежує їх засто- сування тільки для одного переходу в землекористуванні. Наприклад, мо- дель трансформації землі (МТЗ), яка являє собою ШНМ, використовувалась у різних місцях по всьому світу для моделювання тільки однієї зміни. У ро- боті пропонуються різні стратегічні схеми кодування, які можна застосувати для зміни своїх моделей математичної класифікації (МК). В аналізі екологі- чних процесів використовуються три інструменти інтелектуального аналізу даних (ШНМ, РДР і БАРС) для моделювання МК. Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 121 Моделі МК повинні фіксувати кожну комірку на карті до унікального класу землекористування; проте часто комірки можна віднести до більш ніж одного класу землекористування у МК (неоднозначне прогнозування). Деякі моделі можуть комунікувати з декількома класами землекористування, та- ких як комірчасті автоматичні моделі, моделі логістичної регресії, агентсь- ко-орієнтовані моделі і ШНМ. У деяких з них використовується простий ієрархічний підхід до МК, у той час, як в інших — конкурентний підхід до розподілу землі. Дослідження, запропоновані вирішити різними способами МК, не змогли виявити ефективного правила для усунення проблем у моде- люванні МК. Інша мета дослідження — запропонувати простий метод для вирішення проблем шляхом усунення неоднозначних прогнозів. Таким чином, існує необхідність порівняти і протиставити нелінійні ін- струменти для моделювання МК, визначити методи, які працюють краще ніж МК, і дослідити їх виконання для умов, коли кілька переходів у земле- користуванні відбуваються в одному місці. Порівнюються три відомі підхо- ди інтелектуального аналізу даних (ШНМ, РДР і БАРС) для моделювання МК з метою виявлення закономірностей використання земель на Середньо- му Заході США. У дослідженні поєднуються три нелінійні інструменти інтелектуально- го аналізу даних для імітації більш як одного класу для двох різних регіонів Середнього Заходу США. Метою цієї роботи є: 1) запропонувати різні стра- тегії кодування схеми трьох інструментів для кількох переходів з одного стану в інший стан землекористування, розроблених для однієї зміни; 2) розробити ефективні правила для подолання неоднозначних прогнозів МК; 3) порівняти кілька переходів у землекористуванні трьох методів інте- лектуального аналізу даних один з одним щодо їх потенціалу для сільського господарства, лісів та моделювання міського землекористування у басейні річки Маскегон (MRV) та у Південно-східному Вісконсіні (СЕВІ), викорис- товуючи відносну робочу характеристику (ROC) і відсоток правильних по- рівнянь (РСМ); 4) зробити висновки про моделі змін у галузі землекористу- вання на Середньому Заході США. Моделювання РДР. Вузли А, Б, В у дереві містять комірки: міську те- риторію, ліс, землю сільськогосподарського призначення відповідно. Комірка, яка задовольняє умову у вузлах, переходить по лівому плечу, або перехід відбувається по правому плечу. Однак вузли Г (рис. 1) містять комірки — інші переходи у землекористуванні, або які залишаються у тому самому класі землекористування. Відстані до лісу і сільського господарства в СЕВІ та відстані до сільського господарства, доріг і лісів у MRV є най- більш значущими для міських умов, що імітують приріст лісу і сільського господарства одночасно (рис. 1, а, б). За розрахунком приросту визначається якість розмежування (чим більший бал, тим вища якість). Відношення дис- персії до розмежування у міру спадання наведено в табл. 1. За відстані до сільськогосподарських розмежувань 75 м приріст стано- вить 0,065, що набагато нижчий, ніж за основної відстані розмежувань 63 м (за відстані до лісу приріст — 0,094) у СЕВІ. Відстань до чагарника є найк- ращою змінною (51 м), приріст — 0,064 як головний показник у MRV (табл. 1). В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 122 Р ис . 1. В із уа лі за ці я ос но вн их р оз га лу дж ув ач ів Б А Р С : де ре во р іш ен ь у C E B I (а ) і M R V ( б) ; во д- бо л — в од ян ис то -б ол от ис та м іс це ві ст ь; с /г — с іл ьс ьк ог ос по да рс ьк а зе м ля . ( Д ив . т ак ож с . 1 23 ) Я кщ о лі с1  1 00 м Я кщ о лі с1  5 0 м Я кщ о лі с1  10 0 м Я кщ о с/ г1  7 0 м Я кщ о лі с1  80 м Я кщ о лі с1  10 0 м Я кщ о лі с1  1 00 м Я кщ о до ро га 1  14 0 м Я кщ о м іс то 1  70 м Я кщ о с/ г1  50 м Я кщ о до ро га 1  90 м Я кщ о до ро га 1  13 0 м Я кщ о ча га рн ик 1  45 м Я кщ о м іс то 2  0 , 25 м Я кщ о во д- бо л1 .  6 0 м Я кщ о до ро га 1  13 0 м Я кщ о с/ г1  8 0 м Я кщ о во д- бо л1  0, 12 Я кщ о м іс то 1  65 Я кщ о во д- бо л1  8 0 м 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Б А А А А А А А Б Б В В Г Г Г В Г Г Г Г В а Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 123 Р ис . 1 . З ак іе че нн я Я кщ о ч а га рн ик  0 ,0 5 м Я кщ о до ро га <= 12 0 м Я кщ о лі с  15 м 1 Я кщ о с/ г <= 1 5 м Я кщ о ви со чи н а  2 85 м Я кщ о ви со чи н а  29 0 м Я кщ о до ро га  1 45 м Я кщ о с/ г 0 .1 3 м Я кщ о ч а га рн ик  0 ,1 1 Я кщ о ви со чи н а  38 0м Я кщ о с/ г  98 0 м Я кщ о до ро га 1 25 м Я кщ о во д- бо л.  15 м Я кщ о ви со чи на  2 30 м Я кщ о во д- бо л  63 0 м Я кщ о м іс то  0, 03 м Я кщ о м іс то  0, 04 м Я кщ о ча га рн ик  1 5 м Я кщ о ви со чи н а  2 60 м 2 3 4 5 6 8 7 9 10 11 12 13 14 15 16 18 17 19 А А А А А А А Б Б Б Б В В В Г Г Г Г Г Г Я кщ о до ро га  1 20 м Я кщ о до ро га  1 20 м б В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 124 Комірки, розміщені в межах А, Б і В вузлів з великими значеннями придатності мають найбільшу ймовірність існування міських, лісових і при- росту сільськогосподарських земель відповідно (рис. 1, а, б). У СЕВІ комір- ки на вузлі 8 (відстань до лісу менша за 80 м), вузол 20 (відстань до заболо- ченого місця більша ніж 80 м) і вузол 18 (відстань до сільського господарства менша ніж 75 м) найбільш придатні для лісів, міського і сіль- ського господарства відповідно (рис. 1). У MRV комірки у вузлі 17 (відстань до чагарника понад 40 м), вузол 14 (щільність міського господарювання бі- льша ніж 0,04) і вузла 18 (відстань до заболоченого місця більша ніж 60 м) мають найбільшу придатність і вигоду для лісового, міського і сільського господарства відповідно (рис. 1, б). Ця процедура триває від вузла зі значен- нями більшої придатності до інших вузлів з більш низьким значенням при- датності до РДР, де не задовольняється загальна кількість еталонних змін для кожного класу землекористування (табл. 2). Т а б л и ц я 1 . Змінна, розмежування і приріст Крок Змінні Розмежування Приріст СЕВІ О Ліс 1 63 0,09451 1 С/г 1 75 0,06582 2 Місто 1 51 0,03752 3 Ліс 2 0,11346 0,02820 4 Дорога1 121 0,01776 5 Місто 2 0,16735 0,01632 6 Вод-бол 1 51 0,01451 7 C/г 2 0,43037 0,01371 8 Схил 1 3,14572 0,01317 9 Чагарник 1 142 0,00712 10 Парк 1 1499 0,00648 11 Чагарник 2 0,05948 0,00610 12 Вод-бол 2 0,09972 0,00473 13 Височина 1 265 0,00458 14 Вода 1 101 0,00456 15 Потік 1 121 0,00418 16 Аспект 1 0,50 0,00349 MRV О С/г 1 345 0,06587 1 Чагарник 1 51 0,06486 2 Дорога 1 114 0,03823 3 Ліс 1 190 0,03040 4 Місто 2 0,03543 0,01517 5 Місто 1 270 0,01333 6 С/г 2 0,14085 0,00980 7 Височина 1 266 0,00939 8 Вод-бол 1 875 0,00910 9 Чагарник 2 0,13359 0,00829 10 Вод-бол 2 0,04490 0,00374 11 Ліс 2 0,37794 0,00346 12 Потік 1 915 0,00227 13 Парк 1 2772 0,00110 14 Схил 1 1,14232 0,00089 15 Аспект 1 5,58117 0,00056 Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 125 Т а б л и ц я 2 . Приріст, часовий інтервал і розмір комірок для СЕВІ і MRV Місцевість, яка вивчається Часовий інтервал, роки Приріст с/г земель Приріст лісу Приріст міських земель Інші зміни Всього Розмір комірок, м СЕВІ 1990–2000 135,709 79,467 491,031 314,265 1020,472 3030 MRV 1978–1998 120,013 641,237 412,302 693,598 1967,150 3030 Зміни у землекористуванні мають однакові значення придатності комі- рок у кожному вузлі. Дослідник здатен знайти вузли через їх сортування від високих до низьких концентрацій для різних класів землекористування. На- приклад, фермери, містобудівники та управляючі природними ресурсами цікавляться розширенням сільського господарства, урбанізацією і збільшен- ням лісів у певному регіоні (наприклад, вузли 3 і 18 у СЕВІ для збільшення сільського господарства; вузли 10 і 14 у МРВ для урбанізації і вузли 7 і 11 у СЕВІ для збільшення лісів). Показник придатності відображає кожен вид землі, тобто кожен клас з власною відміткою (інші види землекористування, сільськогосподарські землі, ліси і міські землі — Г, В, Б і А відповідно). Ву- зли 3, 5, 7 і 14 мають найвищу концентрацію сільськогосподарських, місь- ких, лісових земель та інших переходів землекористування в СЕВІ. Вузли 11, 10, 19 і 13 мають також найвищу концентрацію сільського, міського гос- подарства та збільшення лісового господарства й інших видів переходів у землекористуванні у MRV відповідно. Моделювання БАРС. Змінна з великим стандартним відхиленням (ANOVA) краще описує взаємозв’язок між входами і виходами. Відстань до сільського господарства зі стандартними відхиленнями 0,74 і 0,29 показу- ють більший внесок для моделювання переходів у землекористуванні в СЕВІ і MRV відповідно (рис. 2). C /г 1 C /г 2 Л іс 1 М іс то 2 Л іс 2 М іс то 1 П от ік 1 В од -б ол 1 В од -б ол 2 Ч аг ар ни к 1 В ис оч ин а 1 В од а1 Ч аг ар ни к 2 П ар к 1 А сп ек т 1 С хи л 1 В од -б ол 1 а 1 П ри рі ст Рис. 2. Дисперсія у БАРС: а — СЕВІ; б — MRV.(Див. також с.126) В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 126 Відстань до міських земель зі стандартним відхиленням 0,31 і відстані до чагарників зі стандартним відхиленням 0,25 вказують на більший внесок для імітації переходів у землекористуванні в СЕВІ і MRV (рис. 2), відстань до чагарників із чотирьох базисних функцій в СЕВІ і підвищенні до 8 базисних функцій у MRV містять найбільшу кількість базисних функцій в БАРС (табл. 3). Т а б л и ц я 3 . Коефіцієнти, змінні та вузли в БАРС для СЄВІ N Коефіцієнт Змінна Стан Вузол 0 –0,984680 1 –0,061248 С/г 1 – 67 2 0,035816 С/г 1 + 67 3 –0,031057 Місто 1 + 42 4 –0,015252 Вод-бол 1 – 161 5 0,014962 Вод-бол 1 + 161 6 –0,001308 Дорога 1 – 161 7 0,003081 Дорога 1 + 161 8 –0,022361 Вод-бол 1 + 60 9 -0,000101 Вода 1 – 90 10 –0,006427 Вода 1 + 90 11 –0,004736 Чагарник 1 - 366 12 0,004286 Чагарник 1 + 366 13 0,000015 Ліс 1 – 67 14 –0,004473 Ліс 1 + 67 15 0,012819 Місто 1 – 42 16 –3,674577 Місто 2 + 0,7726 17 –1,079093 Місто 2 – 0,7726 18 –3,326859 С/г 2 + 0,0790 19 –2,891896 С/г 2 – 0,0790 20 –0,007839 Чагарник 1 + 134 21 0,000535 Аспект 1 + 145 22 0,000145 Аспект 1 – 145 23 –0,722788 Чагарник 2 + 0,3728 24 –1,050544 Чагарник 2 – 0,3728 25 0,999261 Вод-бол 2 + 0,1020 26 0.056512 Вод-бол 2 – 0.1020 C /г 1 C /г 2 Л іс 1 М іс то 2 Л іс 2 М іс то 1 П от ік 1 Д ор ог а1 В од -б ол 1 Ч аг ар ни к 2 В ис оч ин а1 Ч аг ар ни к 1 П ар к 1 А сп ек т1 С хи л 1 В од -б ол 1 б П ри рі ст Рис. 2. Закінчення Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 127 Продовження табл.. 3 N Коефіцієнт Змінна Стан Вузол 27 0.792730 Ліс 2 + –0.0000 28 –0.006119 Схил 1 – 2.8624 29 –0.027395 Схил 1 + 2.8624 30 0.003083 Чагарник 1 – 174 31 –0.000693 Височина 1 + 267 32 –0.001118 Височина 1 – 267 33 –1.464719 Вод-бол 2 + 0.5492 34 0.002106 Місто 1 + 84 35 -0.000475 Потік 1 + 240 36 0.000135 Потік 1 – 1218 37 0.000110 Вода 1 + 684 38 4.434641 С/г 2 – 0.1045 39 0.000002 Парк 1 + 0.0001 Порівняння моделей інтелектуального аналізу даних Відповідно до РСМ (рис. 3, а) МТЗ і РДР мали однакову точність і більшу точність, ніж БАРС для імітації міського, сільського господарства і збіль- шення лісів в обох регіонах. Без змін (CЕВІ) Місто (МRV) П р и р іс т Ліс (CЕВІ) С/г (CЕВІ) Місто (CЕВІ) С/г (МRV) Без змін (МRV) Ліс (МRV) a Ліс (CЕВІ) Місто (CЕВІ) П р и р іс т Ліс (МRV) С/г (CЕВІ) Місто (МRV) С/г (МRV) б Рис. 3. Розрахований РСМ для незмінних сільськогосподарського, міського та лісо- вого приростів у СЕВІ і MRV; ROC для моделей (ШНМ, РДР, БАРС) для приростів сільського, міського та лісового господарств у СЕВІ і MRV В.В. Мікулін ISSN 1681–6048 System Research & Information Technologies, 2017, № 2 128 Тільки для моделювання збільшення лісу в СЕВІ відмінність між МТЗ і РДР з БАРС була великою і зумовлена тим, що кілька комірок показали приріст лісів протягом 10 років (близько 7,7%). Відповідно до ROC (рис. 3, б) МТЗ і РДР приріст значно перевищив БАРС за даними перевірки. Характе- ристики ROC для трьох моделей були подібні в СЕВІ, проте ROC для МТЗ і РДР більші, ніж ROC для БАРС у MRV. ВИСНОВКИ Таким чином, алгоритми класифікації допомагають зрозуміти існуючу струк- туру даних і можуть бути використані для прогнозування класу землекорис- тування з використанням відповідних методів інтелектуального аналізу да- них. Більшість моделей змін у землекористуванні розроблено для бінарного прогнозування. У цій роботі реформуються три нелінійні інструменти інте- лектуального аналізу даних для моделювання декількох змін для двох різ- них регіонів Середнього Заходу США (сільського господарства, лісових і міських земель). Модифіковано методи МТЗ, РДР і БАРС для МК, які спо- чатку розроблялись для бінарного моделювання змін. Виявлено, що страте- гія кодування один-у-класі (наприклад, МТЗ) є більш придатною, ніж стра- тегії кодування розподіленого висновку (наприклад, РДР і БАРС) для моделювання задач МК. Результати дослідження підтверджують висновок про можливість використання МТЗ, РДР і БАРС для моделювання декількох змін у землекористуванні. Оцінка моделі для бінарної класифікації проста. Використано таблицю на випадок непередбачених обставин для порівняння модельованих процесів і вибору карт земель у двох категоріях — змінних і незмінних. Проте далеко не всі дослідження були зосереджені на побудові моделі змін землекористу- вання для МК або порівняння різних моделей цих змін для багаторазового їх моделювання. Це дослідження дає змогу імітувати кілька переходів земле- користування з використанням нелінійних інструментів. Результати пока- зують, що моделі інтелектуального аналізу даних виконуються досить добре з використанням жорсткої класифікації РСМ і м’якої класифікацію (ROC). Виявлено, що МТЗ дала послідовно вищий ступінь узгодженості ніж РДР і БАРС для кожного класу землекористування. Метод ШНМ має більш висо- ку точність, але мало що пояснює (див. рис. 3). Методи РДР і БАРС перед- бачають, що найбільше їх значення залежать від чинників, пов’язаних з ко- жним видом переходу у землекористуванні (див. табл. 1 і 2). Показано, що зміни у землекористуванні є послідовними у центрально- західній частині США (СЕВІ і MRV). Ділянки біля лісу перетворюються в сільське господарство і сільськогосподарські землі, згодом — у міські. Пе- рший період землекористування, як правило, швидший. Неоднозначні пе- редбачення в МК відбуваються через складність моделей змін, коли підходи до інтелектуального аналізу даних не можуть визначати чіткі межі між кла- сами землекористування. Кількість комірок з неоднозначними прогнозами залежить від здатності процедур інтелектуального аналізу даних розмежо- вувати класи землекористування, різні чинники, кількість еталонних змін для кожного класу землекористування і вихідних класів землекористування. Методика вибору математичної моделі екологічного процесу Системні дослідження та інформаційні технології, 2017, № 2 129 Тут розроблено простий метод для вирішення конфліктних проблем у МК. Це досягається усуненням неоднозначних прогнозів для даних комірок у моделюванні землекористування, яке відображає модельовані карти земле- користування з довільними класами землекористування. Необхідно більш поглиблено вивчати проблематику моделювання кіль- кох переходів землекористування. Моделі землекористування, особливо для МК, генерують як помилковий позитивний результат, так і помилковий не- гативний результат класу помилок. Отже, використання тільки однієї моделі не може бути ідеальним, вони можуть доповнювати одна одну. Застосуван- ня двох або більше потужних інструментів, таких як РДР і БАРС у поєднан- ні з моделлю ШНМ допомагає зрозуміти базовий складний процес у земле- користуванні. ЛІТЕРАТУРА 1. Mihajlović I. Statistical modelling in ecological management using the artificial neu- ral networks (ANNs) / I. Mihajlović, Đ. Nikolić, N. Strbac and Z. Zivković // Serbian Journal of Management. — 2010, No 5 (1). — P. 39–50. 2. Parslow J. Bayesian learning and predictability in a stochastic nonlinear dynamical model / J. Parslow, N. Cressie, P. Campbell E., E. Jones and L. Murray // Eco- logical Applications. — 2013. — No 23 (4). — P. 679–698. 3. Verbeke G. Formal and Informal Model Selection with Incomplete Data / G. Ver- beke, G. Molenberghs and C. Beunckens // Statistical Science. — 2008. — Vol. 23, No. 2. — P. 201–218. 4. Bubna K. Model selection and surface merging in reconstruction algorithms / K. Bubna, C.V. Stewart // Journal Computer Vision and Image Understanding archive. — 2000. — Vol. 80, Issue 2. — P. 215–245. 5. Sucarrat G. Automated Model Selection in Finance: General-to-Specific Modelling of the Mean, Variance and Density. Oxford bulletin of economics and statistics / G. Sucarrat, A. Escribano // Oxford: Wiley-Blackwell. — 2012. — Vol. 74. — P. 716–735. 6. Бідюк П.І. Аналіз часових рядів : навч. посіб. / П.І. Бідюк, В.Д. Романенко, О.Л. Тимощук. — К: НТУУ «КПІ», 2013. — С. 115–158. 7. McCullagh P. Generalized Linear Models [Text] / P. McCullagh, J.A. Nelder. — New York: Chapman & Hall, 1990. — 526 p. Doi: 10.1007/978-1-4899-3242-6. 8. Трухан С.В. Прогнозування актуальних процесів за допомогою узагальнених лінійних моделей / С.В. Трухан, П.І. Бідюк // Наукові вісті НТУУ «КПІ». — 2014. — № 2. — С. 14–20. 9. Довгий С.О. Системи підтримки прийняття рішень на основі статистично- ймовірнісних методів / С.О. Довгий, П.І. Бідюк, О.М. Трофимчук. — К.: Логос, 2014. — 419 с. 10. Tayyebi A. Modeling multiple land use changes using ANN, CART and MARS: Comparing tradeoffs in goodness of fit and explanatory power of data mining tools / A. Tayyebi, Bryan C. Pijanowski // International Journal of Applied Earth Observation and Geoinformation 28 (2014). — P. 102–116. Надійшла 27. 10. 2016