Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера
У статті розглядається підхід до інтегрування гетерогенних геопросторових даних на базі єдиної науково-методичної платформи – теорії свідчень Демпстера-Шейфера. Наведено структурно-логічну схему інтегрування гетерогенних геопросторових даних, суть якої зводиться до послідовного інтегрування таких да...
Збережено в:
Дата: | 2019 |
---|---|
Автори: | , , , , |
Формат: | Стаття |
Мова: | Ukrainian |
Опубліковано: |
Інститут проблем математичних машин і систем НАН України
2019
|
Назва видання: | Математичні машини і системи |
Теми: | |
Онлайн доступ: | http://dspace.nbuv.gov.ua/handle/123456789/162294 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Цитувати: | Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера / М.О. Попов, Л.М. Артюшин, М.В. Топольницький, О.В. Титаренко, Ю.В. Шморгун // Математичні машини і системи. — 2019. — № 3. — С. 35–46. — Бібліогр.: 21 назв. — укр. |
Репозитарії
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-162294 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1622942020-01-07T01:25:58Z Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера Попов, М.О. Артюшин, Л.М. Топольницький, М.В. Титаренко, О.В. Шморгун, Ю.В. Обчислювальні системи У статті розглядається підхід до інтегрування гетерогенних геопросторових даних на базі єдиної науково-методичної платформи – теорії свідчень Демпстера-Шейфера. Наведено структурно-логічну схему інтегрування гетерогенних геопросторових даних, суть якої зводиться до послідовного інтегрування таких даних на трьох базових рівнях: фізичному, логіко-семантичному та прийняття рішень. Проаналізовано особливості інтегрування гетерогенних геопросторових даних на фізичному, логіко-семантичному рівнях та специфіку їх інтегрування на рівні гіпотез (рішень) у рамках теорії свідчень Демпстера-Шейфера, яка полягає у необхідності релевантного опису конфлікту, що потенційно може виникнути при наявності суперечливих свідчень (гіпотез) та отриманні інтервальної оцінки ймовірності настання події, що у свою чергу передбачає розробки або обрання певних правил, які дозволяють її точно розрахувати у визначеному інтервалі. В статье рассматривается подход к интегрированию гетерогенных геопространственных данных на базе единой научно-методической платформы – теории свидетельств Демпстера-Шейфера. Приведена структурно-логическая схема интегрирования гетерогенных геопространственных данных, суть которой сводится к последовательному интегрированию таких данных на трех базовых уровнях: физическом, логико-семантическом и принятия решений. Проанализированы особенности интегрирования гетерогенных геопространственных данных на физическом, логико-семантическом уровнях, а также специфика их интегрирования на уровне гипотез (решений) в рамках теории свидетельств Демпстера-Шейфера, которая заключается в необходимости релевантного описания конфликта, который потенциально может возникнуть при наличии противоречивых свидетельств (гипотез) и получении интервальной оценки вероятности наступления события, что в свою очередь предусматривает разработки или выбор определенных правил, которые позволяют ее точно рассчитать в определенном интервале. The article deals with an approach towards integration of geospatial data based on the unified research and methodical platform – the Dempster-Shafer theory of evidence. The article presents a structural chart of heterogeneous geospatial data integration which enables a consecutive integration of such data at three basic levels: physical, logical-semantic and decision-making. It analyzes peculiarities of heterogeneous geospatial data integration at physical and logical-semantic levels as well as particulars of their integration at the level of hypotheses (decisions) within the Dempster-Shafer theory of evidence which envisages a relevant conflict description that can potentially break out in case of controversial evidences (hypotheses) as well as obtaining interval evaluation of the event likelihood of occurrence, which, in its turn, requires development and selection of certain rules allowing its precise calculation in the determined interval. 2019 Article Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера / М.О. Попов, Л.М. Артюшин, М.В. Топольницький, О.В. Титаренко, Ю.В. Шморгун // Математичні машини і системи. — 2019. — № 3. — С. 35–46. — Бібліогр.: 21 назв. — укр. 1028-9763 http://dspace.nbuv.gov.ua/handle/123456789/162294 528.854:519.722:004.93:004.62 uk Математичні машини і системи Інститут проблем математичних машин і систем НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Обчислювальні системи Обчислювальні системи |
spellingShingle |
Обчислювальні системи Обчислювальні системи Попов, М.О. Артюшин, Л.М. Топольницький, М.В. Титаренко, О.В. Шморгун, Ю.В. Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера Математичні машини і системи |
description |
У статті розглядається підхід до інтегрування гетерогенних геопросторових даних на базі єдиної науково-методичної платформи – теорії свідчень Демпстера-Шейфера. Наведено структурно-логічну схему інтегрування гетерогенних геопросторових даних, суть якої зводиться до послідовного інтегрування таких даних на трьох базових рівнях: фізичному, логіко-семантичному та прийняття рішень. Проаналізовано особливості інтегрування гетерогенних геопросторових даних на фізичному, логіко-семантичному рівнях та специфіку їх інтегрування на рівні гіпотез (рішень) у рамках теорії свідчень Демпстера-Шейфера, яка полягає у необхідності релевантного опису конфлікту, що потенційно може виникнути при наявності суперечливих свідчень (гіпотез) та отриманні інтервальної оцінки ймовірності настання події, що у свою чергу передбачає розробки або обрання певних правил, які дозволяють її точно розрахувати у визначеному інтервалі. |
format |
Article |
author |
Попов, М.О. Артюшин, Л.М. Топольницький, М.В. Титаренко, О.В. Шморгун, Ю.В. |
author_facet |
Попов, М.О. Артюшин, Л.М. Топольницький, М.В. Титаренко, О.В. Шморгун, Ю.В. |
author_sort |
Попов, М.О. |
title |
Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера |
title_short |
Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера |
title_full |
Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера |
title_fullStr |
Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера |
title_full_unstemmed |
Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера |
title_sort |
інтегрування гетерогенних геопросторових даних на основі теорії свідчень демпстера-шейфера |
publisher |
Інститут проблем математичних машин і систем НАН України |
publishDate |
2019 |
topic_facet |
Обчислювальні системи |
url |
http://dspace.nbuv.gov.ua/handle/123456789/162294 |
citation_txt |
Інтегрування гетерогенних геопросторових даних на основі теорії свідчень Демпстера-Шейфера / М.О. Попов, Л.М. Артюшин, М.В. Топольницький, О.В. Титаренко, Ю.В. Шморгун // Математичні машини і системи. — 2019. — № 3. — С. 35–46. — Бібліогр.: 21 назв. — укр. |
series |
Математичні машини і системи |
work_keys_str_mv |
AT popovmo íntegruvannâgeterogennihgeoprostorovihdanihnaosnovíteoríísvídčenʹdempsterašejfera AT artûšinlm íntegruvannâgeterogennihgeoprostorovihdanihnaosnovíteoríísvídčenʹdempsterašejfera AT topolʹnicʹkijmv íntegruvannâgeterogennihgeoprostorovihdanihnaosnovíteoríísvídčenʹdempsterašejfera AT titarenkoov íntegruvannâgeterogennihgeoprostorovihdanihnaosnovíteoríísvídčenʹdempsterašejfera AT šmorgunûv íntegruvannâgeterogennihgeoprostorovihdanihnaosnovíteoríísvídčenʹdempsterašejfera |
first_indexed |
2025-07-14T14:48:54Z |
last_indexed |
2025-07-14T14:48:54Z |
_version_ |
1837634195291111424 |
fulltext |
https://orcid.org/0000-0003-1738-8227
https://orcid.org/0000-0002-7488-7244
https://orcid.org/0000-0002-4848-3270
https://orcid.org/0000-0001-5804-1022
https://orcid.org/0000-0001-5283-5155
© Попов М.О., Артюшин Л.М., Топольницький М.В., Титаренко О.В., Шморгун Ю.В., 2019 35
ISSN 1028-9763. Математичні машини і системи, 2019, № 3
УДК 528.854:519.722:004.93:004.62
М.О. ПОПОВ
*
, Л.М. АРТЮШИН
**
, М.В. ТОПОЛЬНИЦЬКИЙ
***
, О.В. ТИТАРЕНКО
*
,
Ю.В. ШМОРГУН
****
ІНТЕГРУВАННЯ ГЕТЕРОГЕННИХ ГЕОПРОСТОРОВИХ ДАНИХ НА ОСНОВІ
ТЕОРІЇ СВІДЧЕНЬ ДЕМПСТЕРА-ШЕЙФЕРА
*
Науковий Центр аерокосмічних досліджень Землі ІГН НАН України, м. Київ, Україна
**
Державний науково-дослідний інститут авіації, м. Київ, Україна
***
Воєнно-дипломатична академія імені Євгенія Березняка, м. Київ, Україна
****
Київський національний університет імені Тараса Шевченка, м. Київ, Україна
Анотація. У статті розглядається підхід до інтегрування гетерогенних геопросторових даних на
базі єдиної науково-методичної платформи – теорії свідчень Демпстера-Шейфера. Наведено
структурно-логічну схему інтегрування гетерогенних геопросторових даних, суть якої зводиться
до послідовного інтегрування таких даних на трьох базових рівнях: фізичному, логіко-
семантичному та прийняття рішень. Проаналізовано особливості інтегрування гетерогенних ге-
опросторових даних на фізичному, логіко-семантичному рівнях та специфіку їх інтегрування на
рівні гіпотез (рішень) у рамках теорії свідчень Демпстера-Шейфера, яка полягає у необхідності
релевантного опису конфлікту, що потенційно може виникнути при наявності суперечливих свід-
чень (гіпотез) та отриманні інтервальної оцінки ймовірності настання події, що у свою чергу пе-
редбачає розробки або обрання певних правил, які дозволяють її точно розрахувати у визначеному
інтервалі. Крім того, приведено загальні обмеження інтегрування та сформульовано нові підходи
до оцінки ефективності виконання тематичних завдань, які зводяться до обрахунку рівня неви-
значеності на трьох різних рівнях: інформаційних джерел, скомбінованих (інтегрованих) розподі-
лів гіпотез та прийняття рішень. Запропоновано структурно-логічну схему нового методу, який
дає змогу враховувати корельованість і узгодженість гіпотез, конфліктність джерел геопросто-
рових даних, та представлено приклади інтегрування геопросторових даних класичним (комбіна-
ційне правило Демпстера) і авторським методами при вирішенні задач пошуку родовищ вуглевод-
нів та ідентифікації компактних штучних об’єктів. Підтверджено ефективність запропоновано-
го методу, визначено умови і обмеження його застосування.
Ключові слова: інтегрування, геопросторові дані, інтероперабельність, невизначеність, узгодже-
ність гіпотез, конфліктність джерел, теорія свідчень Демпстера-Шейфера.
Аннотация. В статье рассматривается подход к интегрированию гетерогенных геопростран-
ственных данных на базе единой научно-методической платформы – теории свидетельств Демп-
стера-Шейфера. Приведена структурно-логическая схема интегрирования гетерогенных геопро-
странственных данных, суть которой сводится к последовательному интегрированию таких
данных на трех базовых уровнях: физическом, логико-семантическом и принятия решений. Про-
анализированы особенности интегрирования гетерогенных геопространственных данных на фи-
зическом, логико-семантическом уровнях, а также специфика их интегрирования на уровне гипо-
тез (решений) в рамках теории свидетельств Демпстера-Шейфера, которая заключается в необ-
ходимости релевантного описания конфликта, который потенциально может возникнуть при
наличии противоречивых свидетельств (гипотез) и получении интервальной оценки вероятности
наступления события, что в свою очередь предусматривает разработки или выбор определенных
правил, которые позволяют ее точно рассчитать в определенном интервале. Кроме того, приве-
дены общие ограничения интегрирования, сформулированы новые подходы к оценке эффективно-
сти выполнения тематических заданий, которые сводятся к определению уровня неопределенно-
сти на трех разных уровнях: информационных источников, скомбинированных (интегрированных)
распределений гипотез и принятия решений. Предложена структурно-логическая схема нового
метода, который дает возможность учитывать коррелированность и согласованность гипотез,
конфликтность источников геопространственных данных, а также представлены примеры ин-
тегрирования геопространственных данных классическим (комбинационное правило Демпстера) и
36 ISSN 1028-9763. Математичні машини і системи, 2019, № 3
авторским методами при решении задач поиска месторождений углеводородов, идентификации
компактных искусственных объектов. Подтверждена эффективность предложенного метода,
определены условия и ограничения его применения.
Ключевые слова: интеграция, геопространственные данные, интероперабельность, неопределен-
ность, согласованность гипотез, конфликтность источников, теория свидетельств Демпстера-
Шейфера.
Abstract. The article deals with an approach towards integration of geospatial data based on the unified
research and methodical platform – the Dempster-Shafer theory of evidence. The article presents a struc-
tural chart of heterogeneous geospatial data integration which enables a consecutive integration of such
data at three basic levels: physical, logical-semantic and decision-making. It analyzes peculiarities of het-
erogeneous geospatial data integration at physical and logical-semantic levels as well as particulars of
their integration at the level of hypotheses (decisions) within the Dempster-Shafer theory of evidence
which envisages a relevant conflict description that can potentially break out in case of controversial evi-
dences (hypotheses) as well as obtaining interval evaluation of the event likelihood of occurrence, which,
in its turn, requires development and selection of certain rules allowing its precise calculation in the de-
termined interval. Besides, the article sets forth general limitations of integration and new approaches to
efficiency of topical tasks evaluation that basically include calculation of the uncertainty levels at three
different levels: information sources, combined (integrated) distributions of hypotheses and decision-
making. The article presents a structural-logical chart of a new approach enabling to consider hypotheses
correlation and coordination, conflicts of geospatial data sources. It also provides examples of geospatial
data integration to classical (the Dempster’s combination rule) and author’s methods during search for
hydrocarbon deposits and identification of compact artificial objects. The article proves the efficiency of
the proposed method. It defines conditions and restrictions for its use.
Keywords: integration, geospatial data, interoperability, uncertainty, hypotheses coordination, conflicts of
sources, Dempster-Shafer theory of evidence.
DOI: 10.34121/1028-9763-2019-3-35-46
1. Вступ
Як свідчить досвід вирішення природоресурсних, сільськогосподарських, наукових, обо-
ронних та інших складних задач, виникає потреба у залученні різноманітної інформації
щодо об’єктів інтересу. Це, в залежності від потреб, може бути геологічна, геофізична, оп-
тична, радіолокаційна та інша інформація. Для її отримання використовуються відповідні
датчики, сенсори, бази даних. Особливо важливу роль відіграють геопросторові дані
(ГПД), які формуються на основі матеріалів аерокосмічної та наземної зйомки, різноманіт-
них карт, GPS-приладів тощо.
У статті представлено системний підхід до інтегрування ГПД, розглянуто структур-
но-логічну схему інтегрування, особливості проведення інтегрування на різних рівнях, об-
меження інтегрування, підходи до оцінки ефективності виконання тематичних завдань та
приклади їх вирішення на основі теорії свідчень Демпстера-Шейфера (ТСДШ).
2. Постановка задачі
Вивчення об’єкта інтересу та прийняття рішень щодо його стану або подальшої поведінки
потребує наявності єдиної, узгодженої інформаційної моделі. Створюється така модель у
результаті аналізу інформації, що отримується шляхом комплексування (інтегрування) ге-
терогенних даних від різних джерел. Але при цьому існують дві проблеми.
Перша проблема полягає у тому, що датчики геопросторових та інших необхідних
даних мають різну фізичну природу, внаслідок чого дані можуть бути кількісними, описо-
вими (номінальними), аналоговими, цифровими тощо. Вони можуть мати різну достовір-
ність і точність, відрізнятись масштабом, вимірністю (2D, 3D), форматом представлення.
Тобто, при вирішенні зазначених вище задач неминуче мають справу з гетерогенними да-
ними.
ISSN 1028-9763. Математичні машини і системи, 2019, № 3 37
Друга проблема полягає у тому, що трансформування даних в інформацію та її ком-
плексування для послідуючого прийняття рішень – багатоетапний логіко-обчислювальний
процес, можливості автоматизації якого внаслідок його суттєвої складності досить обме-
жені. Тому на сучасному етапі розвитку інформаційних технологій цей процес може бути
реалізований лише за участю людини.
Інтегрування гетерогенних ГПД в таких умовах неможливо без відповідної науково-
методичної платформи.
Метою статті є обґрунтований вибір такої платформи та розроблення на її базі
нового підходу до інтегрування гетерогенних ГПД.
3. Аналіз можливих шляхів вирішення задачі
Моделі і методи, які розробляються для вирішення складних науково-прикладних задач,
звичайно спираються на математичний інструментарій або теорії ймовірностей і статисти-
чних рішень, або теорії нечітких множин. Кожен із цих інструментаріїв має свої особливо-
сті і нішу застосування.
Застосування ймовірнісно-статистичних методів можливе лише за умови наявності
достатньо великих вибірок даних, що описують властивості об’єкта дослідження, причому
області значень таких даних підпорядковуються певним імовірнісним розподілам. Ще од-
ним недоліком імовірнісно-статистичних методів є їх неспроможність обробляти супереч-
ливі дані та дані, відносно яких відсутня будь-яка інформація, тобто фактично існує «не-
знання» щодо об’єкта дослідження [1].
Основна перевага використання теорії нечітких множин полягає у наявності великої
кількості комбінаційних операторів, які дозволяють користувачу адаптувати схему інтег-
рації із специфікою даних [2]. Проте, вибір таких операторів потребує експертних оцінок.
Крім того, ускладнена валідація результатів, які одержуються методами теорії нечітких
множин.
Враховуючи недоліки вказаних методів, перспективним є вивчення можливостей
інтегрувати гетерогенні ГПД за допомогою інструментарію ТСДШ. Теорія свідчень може
бути інтерпретована як узагальнення теорії ймовірності. У теорії ймовірності свідчення
пов’язані тільки з однією із можливих подій. У ТСДШ свідчення може бути пов’язано од-
ночасно з кількома можливими подіями – множиною подій. У результаті в ТСДШ вони
можуть мати сенс на більш високому рівні абстракції без необхідності вдаватися до при-
пущень щодо свідчення в межах множини. Там, де свідчення достатньо обґрунтовані та
дозволяють однозначно визначити їх імовірність, ТСДШ використовує модель традиційної
ймовірності. Однією з її найбільш важливих особливостей є те, що вона дозволяє усунути
неоднозначність визначення різного рівня точності у відношенні інформації та виключає
необхідність у додаткових припущеннях щодо її подання. Крім того, вона дозволяє визна-
чити пряму невизначеність відгуку системи у випадку, коли неточності на вході та на ви-
ході характеризуються множиною або інтервалом [3].
Тому саме ТСДШ пропонується нижче як науково-методична платформа для інтег-
рування гетерогенних ГПД.
4. Структурно-логічна схема інтегрування гетерогенних геопросторових даних
За схемою, наведеною на рис. 1, інтегрування ГПД має здійснюватися на трьох рівнях: фі-
зичному, логіко-семантичному та гіпотез (рішень). Інтегрування гетерогенних даних на
фізичному рівні обумовлено їх різноманіттям і відмінностями та зводиться до конверсії
даних в єдиний формат фізичного представлення. Ця задача пов’язана з проблемою інте-
роперабельності [3]. Вона вирішується шляхом взаємного узгодження багатьох факторів
(рис. 2), якими описуються дані. Таке узгодження означає трансформування кожного фак-
38 ISSN 1028-9763. Математичні машини і системи, 2019, № 3
Рисунок 3 – Послідовність
проведення інтегрування ГПД на
логіко-семантичному рівні
тора до деякого уніфікованого вигляду, що дозволяє далі порівнювати їх в єдиній шкалі та
інтерпретувати в одній логіко-семантичній системі оцінок.
Рисунок 1 – Структурно-логічна схема
інтегрування гетерогенних даних
Рисунок 2 – Фактори забезпечення
інтероперабельності даних
Інтегрування даних на логіко-семантичному
рівні включає селекцію найбільш цінних і характер-
них властивостей об’єкта досліджень по наборах да-
них, формування гіпотез щодо його категорії (класу),
встановлення зв’язків та відносин у контексті пред-
метної області. Основними етапами проведення інте-
грування на цьому рівні є процедури генерування
множин гіпотез, їх аналіз і оцінювання, вибір най-
більш імовірних гіпотез, а також обрання відповід-
них методів класифікування, аналізу зв’язків та ви-
значення відношень (рис. 3).
Як вже відзначалось, генерування, аналіз та
оцінювання гіпотез – складна інтелектуальна задача,
особливо, якщо кожна ситуація має свої особливості
і, як правило, не повторюється, а завдання викону-
ються звичайно в умовах невизначеності, обумовле-
ної чинником випадковості і браком знань. Тому за-
звичай генерування множини гіпотез здійснюється
безпосередньо людиною. Серед гіпотез, які генеру-
ються, можуть бути як позитивні, так і негативні,
тобто такі, які відповідно підтверджують наявність
певної властивості у об’єкта інтересу або ні. При
оцінюванні правдоподібності гіпотез застосовують методи дедуктивного [4] і абдуктивно-
го аналізу [5].
ISSN 1028-9763. Математичні машини і системи, 2019, № 3 39
З точки зору автоматизації когнітивно-аналітичних процесів найбільш перспектив-
ним є кількісний підхід до оцінювання ймовірностей гіпотез, однак психологічні дослі-
дження і практика показують, що людина звичайно намагається уникнути жорстких одно-
значних оцінок (hard estimate), і значно більш схильна до так званих м’яких оцінок (soft
estimates) [6].
«Жорстка» гіпотеза характеризується тільки одним твердженням, наприклад, дослі-
джуваний об’єкт – це «штучний об’єкт». «М’яку» гіпотезу можна представити сукупністю
кількох тверджень щодо досліджуваного об’єкта (явища), які об’єднані математичним
оператором «АБО». Наприклад, досліджуваний об’єкт – це «штучний об’єкт» або «приро-
дний об’єкт». Можливість формування таких гіпотез є об’єктивною реальністю під час ви-
вчення будь-яких складних або простих об’єктів (явищ), оскільки на практиці вкрай рідко
зустрічають дані, аналіз яких дозволяє з високою достовірністю висувати «жорсткі» гіпо-
тези. Така особливість робить сам процес дослідження об’єкта (явища) більш гнучким і
дозволяє уникнути значних помилок під час його аналізу та інтерпретації.
Результатом оцінювання гіпотез є визначення значення їх імовірності. Тому основ-
ною задачею цього етапу є розрахунок зазначених величин для всіх альтернативних гіпо-
тез. Фінальним кроком процедури формування та дослідження гіпотез є вибір множини,
яка найбільш адекватно описує (інтерпретує) вхідні дані. Зазначений етап передбачає порі-
вняння різних інтерпретацій вхідних даних і є, в певному сенсі, вирішенням оптимізацій-
ної задачі. Для вирішення цього питання можуть застосовувати методи математичного
програмування, ймовірнісні або інші методи. Проведення процедур класифікування, аналі-
зу зв’язків та визначення відношень передбачає обрання відповідних методів та підходів з
урахуванням специфіки гетерогенних даних.
Інтегрування на рівні гіпотез (рішень) передбачає об’єднання множин гіпотез (кла-
сифікаційних рішень) за певними правилами в єдиний інформаційний універсум. Для ви-
рішення зазначеного питання пропонується застосовувати ТСДШ [7–9].
Головною особливістю під час інтегрування на цьому рівні є питання обґрунтовано-
сті конфлікту – його релевантність [3, с. 102]. У загальному випадку вона може бути опи-
сана за рахунок урахування особливостей джерел надходження даних, свідчень, які вони
формують, та оператора комбінування, що використовується для їх інтегрування (рис. 4).
Рисунок 4 – Особливості інтегрування гетерогенних ГПД на рівні гіпотез (рішень)
40 ISSN 1028-9763. Математичні машини і системи, 2019, № 3
Саме інтегрування на рівні гіпотез (рішень) є найбільш відповідальним етапом. На
основі отриманих даних на цьому рівні формуються висновки, складається прогноз та
приймається рішення щодо досліджуваного об’єкта (явища).
5. Особливості інтегрування гетерогенних геопросторових даних на рівні гіпотез (рі-
шень)
Відповідно до структурно-логічної схеми (див. рис. 1), перед проведенням інтегрування
гетерогенних ГПД на рівні гіпотез (рішень) формується інтеграційна модель. Для її побу-
дови можуть бути застосовані методи мультимоделювання, зокрема [10]: стикувальний
(docking), груповий (collaboration), взаємодії (interoperation), інтеграційний (integration) та
зв’язності (coupling). Після цього відбувається комбінування (інтегрування) сформованих
гіпотез (класифікаційних рішень) на основі ТСДШ.
У рамках ТСДШ є три важливі функції: функція базового ймовірнісного розподілу
(BPA) або функція маси (m), функція довіри (Belief – Bel) та функція правдоподібності
(Plausibility – Pl). Функція базового ймовірнісного розподілу (функція маси) може бути ін-
терпретована як класична ймовірність [11]. Така концепція була підтримана в [12]. Це ду-
же важлива і корисна інтерпретація ТСДШ, проте необхідно зауважити, що вона не завжди
може продемонструвати повний спектр репрезентативних можливостей BPA [13]. Величи-
на ймовірності події (у класичному розумінні) перебуває в межах нижньої і верхньої гра-
ниць – Belief і Plausibility відповідно:
( ) ( ) ( )Bel A P A Pl A . (1)
Вона визначається однозначно, якщо ( ) ( )Bel A P A . У даному випадку це відпові-
дає класичній теорії ймовірності, тобто всі ймовірності ( )P X однозначно визначаються
для всіх підмножин А універсальної множини Ω [14, с. 97]. В іншому випадку функції
( )Bel A і ( )Pl A можна розглядати як нижню і верхню границі ймовірності, відповідно, де
фактичне значення ймовірність ( )P A знаходиться в інтервалі, що описується. Верхня і
нижня границі ймовірності, які отримані іншими підходами до загальної теорії інформації,
не можуть бути безпосередньо інтерпретовані як функції ( )Bel A та ( )Pl A [15, с. 216].
Тому для визначення величини ймовірності настання події, яка у подальшому за-
стосовується для прийняття інформаційних рішень, необхідно розробити або обрати від-
повідні підходи, що дозволяють її точно розрахувати у визначеному інтервалі.
6. Обмеження інтегрування гетерогенних геопросторових даних
Застосування гетерогенних ГПД при вирішенні різноманітних тематичних завдань накла-
дає ряд обмежень на можливості їх сумісного оброблення та аналізу. В роботі [16] наведе-
но ряд таких обмежень. Серед них необхідно виділити такі:
1. Інтегрування будь-якої кількості ГПД не може замінити джерело (сенсор), яке
найбільш адаптовано під середовище або об’єкт, що досліджується. Будь-яка комбінація
сенсорів може забезпечити надійну роботу системи, проте, окремо зазначені сенсори не
дозволяють визначити характеристики об’єкта або явища, що становить інтерес.
Д. Холомом (D. Hall) наведений приклад механічної системи, в якій окремі сенсори вимі-
рюють швидкість її роботи, рівень вібрації та тиску, що становить цінну інформацію про
експлуатаційні характеристики зазначеної системи, проте, навіть у сукупності, вони не до-
зволять виміряти значення її поточної температури.
2. Наступний рівень (етап) оброблення вхідних ГПД не дозволяє компенсувати або
виправити помилки попереднього рівня (етапу) оброблення. Інтегрування різнорідних
ГПД не дозволяє виправляти помилки попереднього етапу (рівня) оброблення або відсут-
ISSN 1028-9763. Математичні машини і системи, 2019, № 3 41
ності попереднього оброблення вхідних даних. Наприклад, нездатність ідентифікувати або
отримувати необхідні параметри об’єкта дослідження або явища не можуть бути виправ-
лені за допомогою складних алгоритмів розпізнавання образів.
3. Результат інтегрування гетерогенних ГПД може бути гіршим, ніж надана інфор-
мація окремим джерелом (сенсором), якщо використовується некоректна математична мо-
дель, яка описує принцип дії сенсора. Застосування некоректних математичних моделей,
що описують принцип дії сенсора, призведе до викривлення результату інтегрування да-
них, оскільки їх вклад або ефект буде невірним.
4. Під час інтегрування гетерогенних ГПД не існує універсальних алгоритмів їх
комбінування. Не існує оптимальних алгоритмів інтегрування даних. Зазвичай реальні
прикладні програмні продукти не задовольняють обмеженням алгоритмів, які використо-
вуються для інтегрування різнорідних ГПД (наприклад, наявність апріорних даних або
статистично незалежних джерел надходження інформації).
5. Під час інтегрування гетерогенних ГПД завжди не вистачає навчальних вибірок.
У загальному випадку завжди існує проблема з навчальними вибірками, які застосовують-
ся під час, наприклад, розпізнавання образів. Тому необхідно застосовувати гібридні мето-
ди, до яких можна віднести методи моделювання, синтаксичного представлення або їх
комбінацію.
6. Важко оцінити результат, який отримується шляхом інтегрування гетерогенних
ГПД. Однією із головних задач під час розробки системи інтегрування різнорідних ГПД є
оцінка ефективності її застосування в реальних умовах. Навіть при наявності показників
ефективності окремих джерел (сенсорів) щодо виконання поставлених завдань або алгори-
тмів обробки визначити ефективність системи зазвичай складно, оскільки не завжди зро-
зуміло, яким чином той або інший підхід до інтегрування даних дозволить якісно функціо-
нувати системі в операційному середовищі.
7. Інтегрування гетерогенних ГПД є нестатичним процесом. Процес інтегрування
різнорідних ГПД є ітераційним, динамічним процесом, який постійно спрямований на уто-
чнення оцінки об’єкта дослідження.
Безумовно, наведені вище обмеження мають бути враховані під час розроблення ві-
дповідних методів або способів інтегрування різнорідних ГПД.
7. Невизначеність як характеристика контенту для прийняття інформаційних рішень
Як було відзначено, одним з обмежень процесу інтегрування різнорідних ГПД є складність
оцінки його результату. Це пов’язано, в першу чергу, з тим, що наявні (класичні) показни-
ки ефективності, наприклад, достовірність правильного дешифрування (розпізнавання), не
можуть бути напряму використані. Таку ситуацію можна пояснити тим, що в результаті
інтегрування даних є ситуація, коли існує багатоальтернативність рішення, що приймаєть-
ся. Причому жодна з альтернатив не виключається і має власне значення ваги (достовірно-
сті настання події, яку вона характеризує). Крім того, за результатами інтегрування макси-
мальну вагу може мати альтернатива, яка мала мінімальне вхідне значення або може від-
бутись незначне зменшення ваги гіпотези, яка у первинному розподілі мала максимальне
значення і за результатами інтегрування його зберегла. Тому традиційний підхід до оцінки
інформаційного контенту, який полягає у застосуванні ймовірнісно-статистичних методів
як єдиний і достатній, не може бути застосований.
З огляду на це, для характеристики інформаційного контенту, на основі якого
приймаються інформаційні рішення, авторами пропонується оцінювати рівень невизначе-
ності (T). Такий підхід обумовлений тим, що процес аналізу та інтерпретації інтегрованих
даних розглядається як інформаційний процес, у результаті якого знімається деяка неви-
значеність щодо досліджуваного об’єкта (явища) [17, с 12]. У свою чергу, збільшення кіль-
кості інформації або її приріст безпосередньо впливають на достовірність його аналізу та
42 ISSN 1028-9763. Математичні машини і системи, 2019, № 3
інтерпретації. При наявності приросту інформації щодо досліджуваного об’єкта потенцій-
но має відбуватись підвищення достовірності його аналізу та інтерпретації [18, 19, с. 43].
Для оцінки ефективності виконання тематичного завдання при інтегруванні гетеро-
генних ГПД, крім орієнтування на відповідну вагу (достовірність) кожної альтернативи,
пропонується оцінювати приріст інформації I m щодо досліджуваного об’єкта (явища),
який можна обрахувати за таким виразом:
( ) ( ) ( )pr psI m T m T m , (2)
де ( ), ( )pr psT m T m – первинний та апостеріорний рівні невизначеності щодо об’єкта (яви-
ща) відповідно.
У рамках ТСДШ можна виділити три рівні обрахунку значення невизначеності: рі-
вень інформаційних джерел, скомбінованих (інтегрованих) розподілів гіпотез та прийняття
рішень. Для обрахунку значення невизначеності на рівні інформаційних джерел та скомбі-
нованих (інтегрованих) розподілів гіпотез можуть бути застосовані вирази, запропоновані
Дж. Кліром (G. Klir) [13, 20]:
– для рівня інформаційних джерел:
2
2( ) ( ) log ( ) ,source
A B
A
T m m A m B
A B (3)
де ( )m A , ( )m B – функція маси для підмножин A і B відповідно;
A – кількість елементів (кардинальність) підмножини A ;
A B – кількість елементів перетину підмножин A і B .
Такий підхід до обрахунку невизначеності може бути використаний для проведення
процедур оптимізації обрання інформаційних джерел ГПД при вирішенні тих чи інших те-
матичних задач;
– для рівня скомбінованих (інтегрованих) розподілів гіпотез:
2 2 2
1
( ) ( ) log ( ( ) log ( ) ( ) log ( ))hypotheses
A A
T m m А A Bel A Bel A Pl A Pl A
c , (4)
де c визначається як
( ( ) ( )).
A
c Bel A Pl A (5)
Для обрахунку невизначеності на рівні прийняття рішень може бути застосовано
значення ймовірнісної інформаційної ємності (Probabilistic Information Content (PIC) [21]:
2
12
1
1 ( ) log ( ( ))
log
N
n n
n
PIC P A P A
N
, (6)
де N – загальна кількість гіпотез.
Підходи, які представлені виразами (4)–(6), є квінтесенцією вирішення конкретної
тематичної задачі при проведенні інтегрування різнорідних ГПД та поряд із використан-
ням класичних імовірнісно-статистичних методів дозволяють додатково оцінити отрима-
ний результат.
Таким чином, можна констатувати, що особливістю при інтегруванні різнорідних
ГПД є процедура обрахунку рівня невизначеності щодо досліджуваного об’єкта (явища).
Невизначеність при інтегруванні гетерогенних ГПД – це нове поняття для характеристики
контенту, яке призначене для осіб, що приймають інформаційні рішення.
ISSN 1028-9763. Математичні машини і системи, 2019, № 3 43
8. Приклади вирішення тематичних задач на основі запропонованого підходу
Було застосовано комбінаційне правило Демпстера для інтегрування геолого-геофізичних
даних, супутникових даних і окремих шарів цифрової моделі місцевості при вирішенні
двох задач: пошуку покладів нафти і газу та ідентифікації компактних штучних об’єктів.
Результати інтегрування наведено на рис. 5 та рис. 6.
Подібний підхід дозволив:
1. Спрогнозувати нафтогазоносність для території Липоводолинського родовища.
Проте, для більшої її частини такий прогноз став неможливим, оскільки значення функцій
довіри і правдоподібності дорівнюють нулю (рис. 5 а) [7, с. 41].
2. Виділити чіткі зони, які підкреслюють зони розущільнення, вузли перетину роз-
ломів різних напрямів, що є перспективними для наявності скупчень вуглеводнів, для пів-
нічно-західного шельфу Чорного моря. Одночасно чітко визначились зони концентрації
структур, виявлених геофізичними методами, хоча деякі виявлені і підготовлені до глибо-
кого буріння структури потрапили в зони низької ймовірності (рис. 5 б) [3, с. 93].
а б
Рисунок 5 – Результат застосування комбінаційного правила Демпстера у задачі пошуку
покладів нафти та газу: а) для Липоводолинського родовища [7];
б) для північно-західного шельфу Чорного моря [3]
а б
Рисунок 6 – Результат застосування комбінаційного правила Демпстера
у задачі ідентифікації компактних штучних об’єктів:
а) для багатоспектральних/гіперспектральних аерокосмічних зображень [9];
б) для даних аерокосмічного знімання та окремих шарів цифрової моделі місцевості
3. Виявити з достатньо високою точністю ( [0,7; 0,94])P на об’єднаному зобра-
женні клас об’єктів, який не вдавалось виділити на окремому супутниковому гіперспект-
ральному зображенні (рис. 6 а) [9, с. 66].
44 ISSN 1028-9763. Математичні машини і системи, 2019, № 3
4. Віднести кожний об’єкт інтересу до конкретного виду, підвищити достовірність
його інтерпретації та аналізу в середньому на 44 % та зменшити рівень невизначеності на
13 % (рис. 6 б).
Проте, головним недоліком під час використання класичних положень ТСДШ для
інтегрування гетерогенних ГПД на рівні рішень є спірність результату, що отримується, в
умовах значного конфлікту між джерелами надходження інформації [2, с. 132], що підтве-
рджується отриманими результатами.
Для нівелювання зазначеного недоліку авторами, керуючись положеннями, сфор-
мульованими вище у пп. 4–7, було розроблено метод, який дозволяє врахувати корельова-
ність і узгодженість гіпотез та конфліктність джерел ГПД [3]. Його структурно-логічну
схему наведено на рис. 7.
Рисунок 7 – Структурно-логічна схема запропонованого методу
Результати застосування розробленого методу для вирішення тих самих задач наве-
дено на рис. 8.
а б
Рисунок 8 – Результат застосування запропонованого методу:
а) у задачі пошуку покладів нафти та газу для Липоводолинського родовища;
б) у задачі ідентифікації компактних штучних об’єктів для даних аерокосмічного знімання та
окремих шарів цифрової моделі місцевості
ISSN 1028-9763. Математичні машини і системи, 2019, № 3 45
1. Запропонований метод дозволяє віднести кожний об’єкт інтересу до конкретного
виду, підвищити достовірність його інтерпретації та аналізу в середньому на 4 % та змен-
шити рівень невизначеності на 28 % (рис. 8 б).
2. Основна перевага запропонованого методу – позбавлення недоліків, що характе-
рні для комбінаційного правила Демпстера, можливість переходу від інтервальної до точ-
кової оцінки [7, с. 38].
9. Висновки
Запропоновано та обґрунтовано новий підхід до інтегрування гетерогенних геопросторо-
вих даних. Наведено структурно-логічну схему інтегрування, особливості його проведення
на різних рівнях. Як науково-методичну платформу для проведення інтегрування обрано
теорію свідчень Демпстера-Шейфера. Крім того, приведено загальні обмеження інтегру-
вання, сформульовано нові підходи до оцінки ефективності виконання тематичних завдань
та представлено приклади їх вирішення на рівні гіпотез (рішень).
Отримані результати дають підстави стверджувати про можливість застосування
теорії свідчень Демпстера-Шейфера для проведення інтегрування гетерогенних геопросто-
рових даних на рівні гіпотез (рішень) та її дієздатність у класичному вигляді лише для ви-
падків, коли конфлікт між джерелами надходження інформації є мінімальним.
Для нівелювання зазначеного недоліку пропонується новий метод, який дозволяє
врахувати корельованість і узгодженість гіпотез та конфліктність джерел геопросторових
даних. Результати застосування запропонованого методу для тих же тематичних задач до-
зволяють зробити висновок, що він позбавлений недоліку, який характерний для комбіна-
ційного правила Демпстера, і дає можливість перейти від інтервальної до точкової оцінки
відповідної гіпотези.
Подальші дослідження мають бути спрямовані на узагальнення розвинених у статті
методів інтегрування на випадки, коли необхідно здійснити комплексний аналіз та інтерп-
ретацію суттєво неоднозначних даних (soft data), наприклад, експертних даних, і достатньо
точних даних (hard data), наприклад, даних, отриманих технічними засобами видового спо-
стереження.
СПИСОК ДЖЕРЕЛ
1. Le Hegarat-Mascle S., Bloch I., Vidal-Madjar D. Application of Dempster–Shafer evidence theory to
unsupervised classification in multisource remote sensing. IEEE Transactions on Geoscience and Remote
Sensing. 1997. Vol. 35, N 4. Р. 1018–1031.
2. Дюбуа Д., Прад А. Теория возможностей. Приложения к представлению знаний в информатике.
Москва: Радио и связь, 1990. 228 с.
3. Novel Remote Sensing Methods for Mineral Prospecting: monograph / ed. V.I. Lyalko, M.O. Popov.
K.: NASU, 2017. 221 p.
4. Josang A. Conditional reasoning with subjective logic. Journal of Multiple-Valued Logic and Soft
Computing. 2008. Vol. 1, N 15. P. 5–38.
5. Fischer H.R. Abductive reasoning as a way of worldmaking. The Impact of Radical Constructivism on
Science. 2001. Vol. 6, N 4. P. 361–383.
6. Heuer R. Psychology of intelligence analysys. Washington, DC: Center for Study of Intelligence. Cen-
tral Intelligence Agency, 1999. 184 p.
7. Попов М.О., Станкевич С.А., Топольницький М.В., Титаренко О.В. Інтеграція дистанційних та
геолого-геофізичних даних при пошуках покладів нафти та газу на суходолі. Екологічна безпека та
природокористування. 2017. № 1–2 (23). С. 36–43.
8. Shafer G. A mathematical theory of evidence. Princeton: Princeton University Press, 1976. 297 p.
9. Попов М.О., Топольницкий М.В. Классификация объектов на многоспектраль-
ных/гиперспектральных аэрокосмических изображениях на основе теории свидетельств Демпсте-
ра-Шейфера. Математичні машини і системи. 2014. № 1. С. 58–69.
46 ISSN 1028-9763. Математичні машини і системи, 2019, № 3
10. Zeigler B.P., Praehofer H., Kim T.G. Theory of Modeling and Simulation: Integrating Discrete Event
and Continuous Complex Dynamic Systems. 2
nd
ed. NY: Academic Press, 2000. 510 p.
11. Chokr B., Kreinovich V. How far are we from complete knowledge? Complexity of knowledge acqui-
sition in the Dempster-Shafer approach. Advances in the Dempster-Shafer Theory of Evidence / eds. R.R.
Yager, J. Kacprzyk, M. Fedrizzi. NY: John Wiley & Sons, 1994. Р. 555–576.
12. Kramosil I. Probabilistic Analysis of Belief Functions. NY: Kluwer Academic, 2001. 214 р.
13. Klir G.J., Wierman M.J. Uncertainty-Based Information: Elements of Generalized Information Theo-
ry. Berlin: Springer-Verlag Berlin Heidelberg, 1999. 168 р.
14. Yager R.R. On the Dempster–Shafer Framework and New Combination Rules. Information Sciences.
1987. Vol. 41. P. 93–137.
15. Dubois D., Prade H. On the combination of evidence in various mathematical frameworks. Reliability
Data Collection and Analysis. 1992. Р. 213–241.
16. Hall D.L., McMullen Sonya A.H. Mathematical techniques in multisensor data fusion. 2
nd
edition.
Norwood, MA: Artech House, 2004. 449 p.
17. Богомолов Л.А. Дешифрирование аэроснимков. М.: Недра, 1976. 145 с.
18. Марр Дж. Информационный подход к изучению представления и обработки зрительных обра-
зов / пер. с англ. М.: Радио и связь, 1987. 400 с.
19. Аковецкий В.И. Дешифрирование снимков: учеб. для вузов. М.: Недра, 1983. 374 с.
20. Klir G.J. Uncertainty and information measures for imprecise probabilities: An overview. Proc. of 1
st
International Symposium on Imprecise Probabilities and Their Applications (Ghent, Belgium, 29 June–2
July 1999). Ghent, 1999. P. 234–240.
21. Sudano J. Pignistic probability transforms for mixes of low – and highprobability events. Proc. of Int.
Conf. on Information Fusion 2001 (Montreal, Canada, August 2001). Montreal, 2001. P. 23–27.
Стаття надійшла до редакції 22.05.2019
|