Від коваріацій до каузальності. Відкриття структур залежностей у даних

Проаналізовано сучасну методологію виводу каузальних моделей та структур систем імовірнісних залежностей із статистичних даних пасивних спостережень. Висвітлено можливості, проблеми, застереження та обмеження методів індуктивної ідентифікації каузальних відношень в апараті марковських властивостей т...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2011
1. Verfasser: Балабанов, О.С.
Format: Artikel
Sprache:Ukrainian
Veröffentlicht: Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України 2011
Schriftenreihe:Системні дослідження та інформаційні технології
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/50132
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Від коваріацій до каузальності. Відкриття структур залежностей у даних / О.С. Балабанов // Систем. дослідж. та інформ. технології. — 2011. — № 4. — С. 104-118. — Бібліогр.: 21 назв. — укр.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-50132
record_format dspace
spelling irk-123456789-501322013-10-06T03:06:35Z Від коваріацій до каузальності. Відкриття структур залежностей у даних Балабанов, О.С. Математичні методи, моделі, проблеми і технології дослідження складних систем Проаналізовано сучасну методологію виводу каузальних моделей та структур систем імовірнісних залежностей із статистичних даних пасивних спостережень. Висвітлено можливості, проблеми, застереження та обмеження методів індуктивної ідентифікації каузальних відношень в апараті марковських властивостей та баєсових мереж. Виділено кілька ступенів каузальних моделей згідно з рівнем їх обґрунтованості та адекватності джерелу даних. Сформульовано статистичний паттерн, який зводить обґрунтування висновку про каузальний характер зв’язку двох змінних до тестування набору статистичних фактів (не)залежності. Проанализирована современная методология вывода каузальных моделей и структур систем вероятностных зависимостей из статистических данных пассивных наблюдений. Освещены возможности, проблемы, оговорки и ограничения методов индуктивной идентификации каузальных отношений в аппарате марковских свойств и байесовых сетей. Выделены несколько ступеней каузальных моделей согласно уровню их обоснованности и адекватности источнику данных. Сформулирован статистический паттерн, который сводит обоснование вывода о каузальном характере связи двух переменных к тестированию набора статистических фактов (не)зависимости. The current methodology of output casual models and structures of systems of probabilistic dependencies of stafistical data of passive observation is analysed. The problems, features, traps and limitations of the methods of the inductive identification of casual relation in the unit of marcov properties and bayesias nets are highlighted. Several stages of casual models according to the level of their validity and adequacy of the data source are emphasized. The statistical pattern, which brings the justification of a finding about casual nature of the connections between two variables to the test of a set of statistical facts of (in)dependency is formulated. 2011 Article Від коваріацій до каузальності. Відкриття структур залежностей у даних / О.С. Балабанов // Систем. дослідж. та інформ. технології. — 2011. — № 4. — С. 104-118. — Бібліогр.: 21 назв. — укр. 1681–6048 http://dspace.nbuv.gov.ua/handle/123456789/50132 681.3.00:007 uk Системні дослідження та інформаційні технології Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Ukrainian
topic Математичні методи, моделі, проблеми і технології дослідження складних систем
Математичні методи, моделі, проблеми і технології дослідження складних систем
spellingShingle Математичні методи, моделі, проблеми і технології дослідження складних систем
Математичні методи, моделі, проблеми і технології дослідження складних систем
Балабанов, О.С.
Від коваріацій до каузальності. Відкриття структур залежностей у даних
Системні дослідження та інформаційні технології
description Проаналізовано сучасну методологію виводу каузальних моделей та структур систем імовірнісних залежностей із статистичних даних пасивних спостережень. Висвітлено можливості, проблеми, застереження та обмеження методів індуктивної ідентифікації каузальних відношень в апараті марковських властивостей та баєсових мереж. Виділено кілька ступенів каузальних моделей згідно з рівнем їх обґрунтованості та адекватності джерелу даних. Сформульовано статистичний паттерн, який зводить обґрунтування висновку про каузальний характер зв’язку двох змінних до тестування набору статистичних фактів (не)залежності.
format Article
author Балабанов, О.С.
author_facet Балабанов, О.С.
author_sort Балабанов, О.С.
title Від коваріацій до каузальності. Відкриття структур залежностей у даних
title_short Від коваріацій до каузальності. Відкриття структур залежностей у даних
title_full Від коваріацій до каузальності. Відкриття структур залежностей у даних
title_fullStr Від коваріацій до каузальності. Відкриття структур залежностей у даних
title_full_unstemmed Від коваріацій до каузальності. Відкриття структур залежностей у даних
title_sort від коваріацій до каузальності. відкриття структур залежностей у даних
publisher Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
publishDate 2011
topic_facet Математичні методи, моделі, проблеми і технології дослідження складних систем
url http://dspace.nbuv.gov.ua/handle/123456789/50132
citation_txt Від коваріацій до каузальності. Відкриття структур залежностей у даних / О.С. Балабанов // Систем. дослідж. та інформ. технології. — 2011. — № 4. — С. 104-118. — Бібліогр.: 21 назв. — укр.
series Системні дослідження та інформаційні технології
work_keys_str_mv AT balabanovos vídkovaríacíjdokauzalʹnostívídkrittâstrukturzaležnostejudanih
first_indexed 2025-07-04T11:37:15Z
last_indexed 2025-07-04T11:37:15Z
_version_ 1836716168285519872
fulltext © О.С. Балабанов, 2011 104 ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 TIДC МАТЕМАТИЧНІ МЕТОДИ, МОДЕЛІ, ПРОБЛЕМИ І ТЕХНОЛОГІЇ ДОСЛІДЖЕННЯ СКЛАДНИХ СИСТЕМ УДК 681.3.00:007 ВІД КОВАРІАЦІЙ ДО КАУЗАЛЬНОСТІ. ВІДКРИТТЯ СТРУКТУР ЗАЛЕЖНОСТЕЙ У ДАНИХ О.С. БАЛАБАНОВ Проаналізовано сучасну методологію виводу каузальних моделей та структур систем імовірнісних залежностей із статистичних даних пасивних спостережень. Висвітлено можливості, проблеми, застереження та обмеження методів індуктивної ідентифікації каузальних відношень в апараті марковських властивостей та баєсових мереж. Виділено кілька ступенів каузальних моделей згідно з рівнем їх обґрунтованості та адекватності джерелу даних. Сформульо- вано статистичний паттерн, який зводить обґрунтування висновку про кау- зальний характер зв’язку двох змінних до тестування набору статистичних фактів (не)залежності. ВСТУП Серед задач, що розглядаються в контексті методології виділення знань з даних, мабуть, найцікавішою та когнітивно значущою видається ідентифі- кація каузальних відношень на основі апарату багатовимірних імовірнісних моделей залежностей та марківських властивостей [1–8]. Можливість іден- тифікації каузальних відношень у такий спосіб викликала гострі заперечен- ня. Деякі підсумки дискусії підведені в [8, 9]. Традиційно в емпіричних нау- ках каузальні відношення встановлювали через контрольовані рандомізовані експерименти, тобто на основі даних активних експериментів. Натомість методи виділення знань з даних, як правило, використовують дані пасивних спостережень. Задача виведення каузальних моделей саме з даних пасивних спостережень є дуже привабливою й актуальною для багатьох сфер діяль- ності та досліджень, де активні експерименти неможливі практично або не- виправдані економічно, або з етичних міркувань. Така ситуація постає, при- міром, у соціально-економічних та медико-біологічних дослідженнях, в астрономії, метеорології, геології та іноді навіть у техніці. Крім того, може бути невідома темпоральна (часова) послідовність змінних. Новітня емпіри- ко-індуктивна методологія [1, 3, 5, 8] відкриває реальні можливості розв’язання задач за таких умов. Каузальні моделі посідають, так би мовити, найвищий рівень в ієрархії емпіричних моделей. В англомовній літературі каузальними мережами (діа- грамами) називають імовірнісні моделі на основі ациклічних орієнтованих графів (АОГ), або їх розширення. Синтаксис АОГ-моделей дозволяє вирази- ти каузальну семантику. Однак питання полягає в іншому: чи можна (без Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 105 апріорних знань) вивести з даних АОГ-модель, яка адекватно відображає каузальні відношення в предметній галузі, звідки взято статистичні дані. Мета роботи — характеристика можливостей і обмежень методів ви- ведення каузальних моделей з даних пасивних спостережень. Провадиться не зовсім строга, але корисна класифікація рівня обґрун- тованості висновків про причинно-наслідковий характер виведених зв’язків у моделі. Оскільки зазначена тематика розвивалася кількома школами і до неї за- лучилися різні наукові спільноти — філософи, статистики, інформатики, дослідники з природничих та соціальних дисциплін, то в літературі існують розбіжності в трактуванні визначень і термінології. Намір автора — стисло і цілісно подати принципи та ключові положення предмета, а також вказати на менш відомі результати і запропонувати деякі уточнення. Адекватність і точність каузальної моделі, виведеної з даних, детермі- нується двома складовими (компонентами) методу виведення. Перша скла- дова — це базові процедури аналізу даних і тестування умовних незалежнос- тей. Друга складова, яка і є предметом розгляду — «логічний» аналіз та синтез статистичних відношень, ідентифікованих першою компонентою. Елементами синтаксису моделі є: вершина (змінна), дуга YX → і реб- ро X — .Y Ребро — це дуга, орієнтація (спрямування) якої невідома або несуттєва в цьому контексті. Введемо якісні градації рівня адекватності кау- зальної моделі. Тобто, будемо виділяти кілька ступенів (ґатунків) моделі та її фрагментів згідно з адекватністю відображення каузальних відношень об’єкта моделювання. Пропонуємо такі градації моделей: псевдокаузальні, протокаузальні, субкаузальні та каузальні. Ґатунок моделі (рівень адекват- ності) визначається такими властивостями: • надійність ідентифікації ребер моделі (топології статистичних зв’язків); • обґрунтованість і надійність ідентифікації орієнтацій ребер моделі (спрямування впливів); • обґрунтованість інтерпретації ребра моделі як каузального зв’язку визначеного напрямку. Якщо всі ребра моделі адекватно відображають топологію безпосеред- ніх зв’язків (залежностей) між змінними (відношення суміжності), будемо називати модель протокаузальною. Якщо при цьому ще і вістря орієнтова- них дуг адекватно відображають автентичні напрямки залежностей (впли- вів) між змінними, то називатимемо модель субкаузальною. При цьому зв’язок змінних YX → інтерпретується так: або змінна ,X або якась асоці- йована з нею H має каузальний вплив на ,Y а змінна Y певно не має кау- зального впливу на .X І нарешті, якщо пред’явлено переконливі аргументи, що змінна X каузально впливає на ,Y то називатимемо модель каузальною (у цій частині моделі). Припустимо, що домен («фрагмент світу»), який моделюється, опису- ється системою ймовірнісних залежностей, структурованих ациклічним орієнтованим графом, тобто у формі АОГ-моделі. Ор-ациклічність каузаль- них структур виправдовується фізичною інтуїцією. Клас АОГ-моделей при- значений для репрезентації систем усталених залежностей (на макрорівні). О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 106 АОГ-модель залежностей визначена як ( θ,G ), де G — АОГ, причому кожній змінній відповідає своя вершина графу, а θ — сукупність локально заданих параметрів. Параметри задано у формі )),(|( XFXp де )(XF — множина всіх «батьків» для ,X тобто тих вершин ,Z від яких прямує дуга .XZ → Якщо є орієнтований шлях ,WR →⋅⋅⋅→ то змінна R називається «предком» для ,W а W — «нащадком» для R . Прийнято виокремлювати три випадки (різновиди) АОГ-моделей. Коли модель визначена на дискрет- них (номінальних) змінних, її називають баєсовою мережею. Гаусові мережі визначено на дійсних змінних і лінійних залежностях (за нормально- розподілених відхилень). Подекуди їх називають також рекурсивними сис- темами лінійних структуральних рівнянь. Гібридні мережі включають змін- ні різних типів. Для відображення каузальних відношень реальних систем потрібно враховувати можливість латентних змінних. При існуванні латент- них змінних модель формально виходить за межі АОГ-моделей і стає пев- ним розширенням, зокрема, класом моделей на основі анцестральних графів [10]. Латентна змінна відображається у моделі біорієнтованим ребром .YX ↔ Наявні дані є багатомірною статистичною відбіркою, яку можна роз- глядати як типову відбірку, генеровану з адекватної АОГ-моделі. Ідентифі- кувати модель — означає відтворити з наявних даних генеративну модель (з точністю до класу еквівалентності). Оскільки нас цікавить відкриття якісних відношень («знань»), доцільно спиратися на сепараційний (constraint-based) підхід до ідентифікації структур моделі. Цей підхід базується на тестах умов- ної незалежності і дає обґрунтування кожного фрагмента моделі. До найві- доміших методів і алгоритмів цього підходу відносяться алгоритми PC, IC, SGS та FCI [1–8]. Методи сепараційного підходу виводять модель у три ета- пи. На першому етапі ідентифікують усі ребра моделі, на другому — визна- чають орієнтації (спрямування) ребер, на третьому — обчислюють парамет- ри. Стислий опис деяких методів можна знайти, зокрема, у [11–13]. ІДЕНТИФІКАЦІЯ ПРОТОКАУЗАЛЬНИХ ВІДНОШЕНЬ Протокаузальна модель має адекватно відображати топологію безпосередніх залежностей (інформаційних зв’язків) між змінними в системі ймовірнісних залежностей, тобто сукупність ребер моделі. Ідентифікація ребер ґрунтуєть- ся на виявленні відношень умовної незалежності. Умовну незалежність X від Y за фіксації (кондиціонування) набору змінних Z позначатимемо формулою );;(Ind YX Z , де Z∉YX , . Така незалежність означає, що ),|(),|( ZZ YpXYp = або еквівалентно ).|()|()|( ZZZ YpXpXYp = Для систем лінійних залежностей умовну незалежність зазвичай виражають че- рез частковий коефіцієнт кореляції 0. =ZXYρ . Нехай чинне твердження умовної незалежності );;(Ind YX S . Тоді для взаємної інформації між X та Y за кондиціонування S легко отримати рівняння 0)|;(Inf =SYX , а також );(Inf);(Inf SS YXY = , =);(Inf SYX );(Inf SX= . Це інтерпретується як відсутність безпосереднього зв’язку між X та .Y Отже, факти умовної незалежності відображають структуру ін- формаційних потоків (статичних зв’язків) між змінними. Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 107 Відношення умовної незалежності в моделі визначаються критерієм d- сепарації і ґрунтуються на каузальній марківській умові [1, 3, 5]. Резонно вимагати, аби модель відображала всі інформаційні та каузальні взаємо- зв’язки в явному вигляді своєю графічною структурою. Тобто, кожна умов- на незалежність, чинна в розподіленні ймовірностей, має виникати тільки у випадку відсутності відкритого (активного) шляху між відповідними вер- шинами графу моделі. Цей принцип називають припущенням необманли- вості (faithfulness) сумісного розподілу ймовірностей [1], або вимогою міні- мальності та стабільності моделі [3]. Коли всі відношення умовної незалежності репрезентовано в моделі графічно, модель задовольняє прин- ципу структурно-поведінкої адекватності. Утім, для коректного виведення всіх ребер моделі з даних можна навіть послабити припущення необманли- вості: безпосередній зв’язок (ребро) між X та Y має бути наявний у моделі тоді і тільки тоді, коли змінні X та Y взаємозалежні в усіх контекстах (умовах). Але навіть таке послаблене припущення іноді порушується. Це трапляється за певних «маскувальних» властивостей співвідношень пара- метрів. Побіч того, інші обставини також можуть перешкоджати виведенню адекватних протокаузальних моделей. Причинами помилок можуть бути: недостатній обсяг даних; гамір та похибки у даних (зокрема, неточні вимі- рювання, округлення змінних); латентні змінні; невдалий вибір функціо- нальної форми залежності. Можна виділити такі форми неадекватності протокаузальної моделі: зайві (псевдокаузальні) ребра та шляхи; втрачені ребра та шляхи; не відо- браження часткового суміщення шляхів; неадекватне відображення емпірич- ної умовної незалежності (комбінація названих вище випадків). Помилки суміжності через вади даних (синдром зайвих та «загуб- лених» ребер). За малих відбірок даних (через значне ухилення ймовірнос- тей) можуть порушуватись співвідношення, які виражають умовну незалеж- ність. Тоді гіпотеза умовної незалежності може бути помилково відкинута під час тестування (ризик помилок збільшується в тестах високого рангу [1, 11]). У результаті структура моделі перенасичується зайвими (псевдокау- зальними) ребрами. Крім того, фальсифіковане ребро може виникнути внаслі- док округлення змінних чи загрублення шкали вимірювання. Припустимо, в автентичній моделі має чинність ),;;(Ind WZR але під час вимірювання чи запису дискретної змінної Z декілька значень було об’єднано (агреговано). Тоді у відбірці даних незалежність );;(Ind WZR може не виконуватись, і виникне зайве ребро R — ,W аналогічне можливе для змінної Z дійсного типу. Зауважимо, що внаслідок округлення змінних можлива і протилежна помилка, коли ребро втрачається. Обманні (превалюючі) асоціації та замасковані ребра. Багато мето- дів статистичного аналізу даних розпочинають із обчислення парних кова- ріацій (асоціацій). У методах ідентифікації структур моделей без циклів су- міжності (зокрема, в алгоритмі Chow&Liu та інших [14–16]) ребра встановлюють згідно з величинами парних асоціацій (кореляцій). Дійсно, якщо в структурі без циклів є пара ребер X( — )Y та Y( — )Z , асоціація змінних X та Z (у типовій відбірці) буде слабшою за асоціації пар змінних ),( YX та ).,( ZY Однак у структурах із циклами суміжності це правило не О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 108 діє, і опосередкована асоціація може перевершити будь-яку «реберну» асоціацію з-поміж тих, на яких вона ґрунтується [16, 17]. Наприклад, нехай маємо гаусову мережу, де змінні X та Y мають кілька спільних «батьків» kZZZ ,,, 21 … (рис. 1). Легко підібрати параметри такої моделі, щоб ковара- ція змінних X та Y була в кілька разів більша, ніж для кожної пари змін- них, що поєднані ребром. Зокрема, нехай ця модель описується рівняннями: XkZZZX ε++++= …21 , YkZZZY ε++++= …21 , .),0(~;),0(~ σεσε NN YX Тоді коваріація X та Y у k разів більша реберних. Для баєсової ме- режі з такою самою структурою можна підібрати такі параметри, що вели- чина );(Inf YX наблизиться до максимально мож- ливого значення (коли дві змінні статистично то- тожні), у той час як усі );(Inf iZX та );(Inf iZY можуть як завгодно зменшуватися і навіть досяга- ти нуля. Тобто, ребра такої моделі не проявляють- ся парними залежностями (і не ідентифікуються наївними методами). Це — синдром «зникаючих» безпосередніх зв’язків (замаскованих ребер). Утім моделі з таким синдромом параметрично неста- більні. Достатньо трохи змінити розподіли змінних iZ , і ребра перестануть бути замаскованими (хоча можуть бути слабкими). Зауважимо, що розглянена структура (рис. 1) належить до підкласу монопотокових моделей і може бу- ти відтворена за допомогою методу «Proliferator-D», який використовує тес- ти умовної незалежності виключно першого та нульового рангу [16]. Ідемпотентні залежності, або ланцюг із «пересувними» ребрами. Нехай маємо дискретну модель ланцюгової структури ZYX →→ ; тоді ви- конується );;(Ind ZYX . У [18] показано, що можна так параметризувати цю структуру, що буде також виконувитися );;(Ind ZXY . Остання незалежність відповідає структурі моделі у вигляді ланцюга Y — X — Z , де змінні роз- ташовано в іншому порядку порівняно з тим, за яким насправді генероване сумісне розподілення ймовірностей. Більше того, сумісне розподілення ймовірностей ),,( ZYX однаково добре узгоджується з ланцюговою струк- турою з будь-яким порядком розташування трьох змінних, зокрема, зі структурою Y — Z — X . Іншими словами, із трьох потенційно можливих ребер можна довільно обрати два. Можна уявити, що два ребра не мають певного місця. Звідси — образна назва «гумка-перевертень». Усього отри- муємо 9 еквівалентних варіантів структури моделі. Утім, слід визнати, що така модель є аномальною і дещо штучною, бо передбачає спеціальні пат- терни значень параметрів. Аналогічний феномен (еквівалентність усіх по- слідовностей змінних у ланцюзі) також спостерігається у функціональних моделях (тобто для детермінованих залежностей). Однак там необхідна од- … Zk Z3 Z1 Z2 X Y Рис. 1. Модель із «двій- никовою» асоціацією Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 109 накова значність усіх змінних, а також і взаємна однозначність функцій. А вказана модель цього не вимагає і має вільні параметри. Зауважимо, що таку модель можна замінити на структуру у вигляді «зірки» з латентною змінною в центрі [19]. ПРОЯВИ ЛАТЕНТНИХ ЗМІННИХ У багатьох реальних дослідженнях задача виведення моделі з даних потер- пає від нестачі релевантних змінних (факторів), тобто через відсутність де- яких змінних у даних. Змінну, яка не репрезентована в даних, не у всіх ви- падках називають латентною. Неприсутню в даних змінну можна назвати: прихованою, оминутою або неспостережуваною. Апарат АОГ-моделей роз- раховано на ситуацію, коли кожна «оминута» змінна iH впливає тільки на одну наявну змінну iX і є незалежною від неприсутніх змінних jH , які ді- ють на інші модельні змінні. Такі неприсутні змінні не вважаються латент- ними. Латентна змінна — це неприсутня змінна, яка накладає суттєвий, якісний відбиток на розподіл імовірностей наявних змінних. Латентна змін- на мусить впливати принаймні на деякі дві спостережувані змінні (тобто надходити до моделі двома дугами). Можна виділити спеціальні випадки оминутої змінної згідно зі схемою її «контакту» з моделлю: «проміжна», коренева, комбінована змінна. Про- міжна прихована змінна H у наведених прикладах (рис. 2, а, 2, в) не тягне ніяких змін марківських властивостей моделі. Але в багатьох випадках дуже бажано, аби змінна у проміжній позиції була наявна в даних. Це корисно для застосування моделі, зокрема, для квантифікацій величини (сили) каузаль- ного ефекту [3]. Власне, латентною змінною зазвичай вважають таку «невидиму» змін- ну, яка є кореневою та впливає на дві (чи більше) явних змінних моделі (рис. 2, б, 2, г). Але й така латентна змінна може не відбиватися на марківсь- ких властивостях (рис. 2, б). Латентна змінна в різних контекстах накладає різні паттерни залежностей. Коли латентна змінна формує фрагмент W- образної конфігурації (рис. 2, г), факт її існування проявляється статистично [7]. А саме, для випадку рис. 2, г латентна змінна ідентифікується на підста- ві нетранзитивності емпіричної залежності через ребро X — Y в обох на- прямках, тобто на підставі такої комбінації статистичних фактів: залежність пар змінних ),( RX , ),( YX та ),( ZY , і незалежність пар змінних ),( ZX , ),( YR та ),( ZR . Латентна змінна з комбінованою роллю, навіть у простому варіанті (рис. 3, а), породжує складності відображення відношень у моделі. Дворебер- ний сурогат структури (рис. 3, б) для такої ситуації є неадекватним, тому що тягне умовну незалежність );;(Ind ZXY , що не узгоджується з даними і чого немає в генеративній моделі. Триреберний сурогат (рис. 3, в) є неадекватним у тому, що залучає «нестандартне» (біорієнтоване) ребро і не відображає часткового суміщення шляхів. Крім того, є певні складності для параметри- зації такої моделі. У спеціальних випадках така латентна структура може бути ідентифікована [19]. О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 110 Латентні змінні допомагають спрощувати модель. Наприклад, фраг- мент моделі у вигляді дворядного графу з перехресними ребрами (рис. 4, а) можна замінити на модель з одною «вузловою» латентною змінною (рис. 4, б). Унаслідок введення латентної змінної кількість зв’язків та пара- метрів кардинально зменшується. У роботі [20] наявність фрагмента моделі такого вигляду (рис. 4, а) пропонується розглядати як свідоцтво існування латентної змінної. Утім, таке свідоцтво — лише евристичне (слабке) і не є конфірмативним. КАУЗАЛЬНІ ТА СУБКАУЗАЛЬНІ МОДЕЛІ ТА ВІДНОШЕННЯ Для трактовки моделі як каузальної чи субкаузальної необхідно, щоб модель адекватно відтворювала не тільки множину ребер, а також і адекватні (автен- X Y Z H а X Y Z б в X Y Z Рис. 3. «Нестандартна» латентна змінна а … Y X Z U W V б H U W V Y X Z Рис. 4. Модель а спрощується під час введення латентної змінної б X Y H R Z а в X Y H R Z б X Y H R Z г X Y H R Z Рис. 2. Випадки прихованих змінних Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 111 тичні) орієнтації цих ребер. Потенційно така можливість ґрунтується на експресивних можливостях АОГ-моделей і на властивостях відбірки даних та їхнього джерела. Фундаментом для ідентифікації каузальних моделей є постулат, відомий як принцип Рейхенбаха. Статистична асоційованість (взаємозалежність) змінних X та Y може пояснюватися трьома схемами механізму виникнення: • X є причиною для ;Y в апараті АОГ-моделей це означає, що від X до Y веде строго орієнтований шлях ;YX →⋅⋅⋅→ • Y є причиною для X , тобто в моделі має бути шлях ;YX ←⋅⋅⋅← • існує деяка спільна причина U для змінних X та ,Y тобто в моделі має бути шлях YUX →⋅⋅⋅→←⋅⋅⋅← (змінна U може бути латентною). Третя схема може співіснувати з першою або другою. Можливості індуктивної ідентифікації орієнтацій ребер. Задача ідентифікації спрямованості впливу повною мірою постає, коли відсутня темпоральна інформація про змінні моделі. Розпізнання справжніх орієнта- цій ребер базується на властивості колізорів та на теоремі еквівалентності АОГ-моделей. Колізор (колайдер) — це фрагмент орграфу вигляду ZYX ←→ . Цей колізор називається шунтованим (екранованим), якщо у графі є ребро X — Z , інакше — нешунтованим. Змінну ,Y яка входить до складу нешунтованого колізора ←→ Y , назвемо колізорною. Для індуктивного виводу структур АОГ-моделей фундаментальним ре- зультатом є наступна теорема еквівалентності [7]: дві АОГ-моделі є еквіва- лентними, якщо і тільки якщо вони мають одні і ті ж ребра, а також одні і ті ж нешунтовані колізори. Звідси відразу випливає, що в деревах та у повно зв’язаних АОГ- моделях орієнтація жодного ребра не ідентифікується. У методах сепарацій- ного підходу процедура орієнтації ребер виконується на другому етапі алго- ритму, коли всі ребра встановлено. Базовий принцип орієнтації ребер поля- гає у розпізнанні нешунтованих колізорів. Принцип формулюється як «колізорне правило»: якщо маємо X — Y — Z та чинне );;(Ind YX S , де ,,, S∉ZXY то орієнтуємо ребра YX → та .ZY ← Фізичний сенс цього принципу: тільки колізорна орієнтація такого двореберного шляху може по- яснити нерозповсюдження інформації між X та Z через проміжну .Y Ду- ги, орієнтовані за ознакою колізора, вважаємо субкаузальними. Неколізорні ребра теж можуть бути однозначно орієнтовані, а саме то- ді, коли їх орієнтація логічно випливає з вимог орациклічності та уникнення несанкціонованих колізорів. Дійсно, якщо колізорне правило вже не вдаєть- ся застосовувати і маємо дугу ,YX → а також ребро Y — ,Q причому Q не суміжна до ,X то ребро Y — Q має бути орієнтоване як QY → . Отже, ребро, яке дотичне до стрілки, але не задовольняє ознакам нешунтованого колізора, має бути орієнтоване так, щоб запобігти виникненню необґрунто- ваного колізора. Це правило можна назвати пост-колізорним. Зазначеними правилами не орієнтуються ті ребра, які не утворюють нешунтованих колізорів, не дотичні нащадкам колізорних вершин, а також ребра між вершинами, які мають ідентичні набори «батьків». Як приклад останнього випадку, неорієнтованими залишаються ребра, що з’єднують О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 112 «братів» (ребро 2–3 на рис. 5, а). Не вдається орієнтувати ребра між «пред- ками» колізорних вершин (у кореневій частині орграфу). Фрагмент моделі, який не вдається орієнтувати зазначеними правилами, назвемо фрагментом з варіабельними орієнтаціями (еквівалентні моделі мають альтернативні орієн- тації ребер цього фрагмента). Кожне ребро у складі фрагмента з варіабель- ними орієнтаціями допускає довільну орієнтацію (коли розглядається окре- мо), однак сукупність суміжних ребер не може бути орієнтована довільно. Тобто, усі припустимі варіанти орієнтації ребер зв’язного фрагмента підлягають певним «системним» («топологічним») обмеженням. Нехай маємо кореневий фрагмент із варіабельними орієнтаціями. Від- сутність нешунтованих колізорів означає, що в цьому фрагменті всі неорієн- товані цикли довжиною більше трьох ребер є трикутизованими (мають хор- ду). Вершину X цього фрагмента назвемо коренем, якщо в обраній моделі з класу еквівалентності всі ребра фрагмента дотичні до ,X є спрямованими від вершини ,X тобто мають вигляд →← X . «Системні» обмеження на орієнтації імплікуються такими синтаксичними вимогами: у кожній зв’язаній компоненті фрагмента має бути не менше одного кореня; усі корені — не- суміжні; у кожному циклі має бути принаймні один колізор (шунтований) і стільки ж коренів. Наприклад, розглянемо рис. 5, б. Припустимо, що ребра такої моделі не орієнтуються. Тоді, хоча граф такої моделі не є деревом, у ньому мусить бути тільки одна коренева вершина (цим коренем може виявитися довільна вершина). Те саме стосується графу моделі, зображеного на рис. 5, в. Граф на рис. 5, б репрезентує (охоплює) 14 еквівалентних моделей, а граф на рис. 5, в — 16 моделей. У випадку, коли фрагмент із варіабельними орієнтаціями — некорене- вий, вказані обмеження узагальнюється так: у складі фрагмента існує вер- шина, яка є «предком» усіх інших вершин фрагмента. Якщо є потреба ідентифікувати автентичні орієнтації ребер, які не орієн- туються колізорним та пост-колізорним правилами, аналітику доведеться вдатися до «слабких» методів, які не гарантують статистично спроможних (коректних) результатів. У певних ситуаціях можуть бути корисними еврис- тичні критерії. Наприклад, коли є один домінуючий фактор впливу на зада- ну змінну, можна розпізнати напрямок за допомогою міри дельта- детермінації [15]. Коли задача зводиться до вибору кореня дерева, то для підвищення шансів розпізнання кореня доцільно застосувати дельта- детермінацію в «колективному» режимі. Концепція індуктивної каузальності. Деякі скептики заперечують ка- узальну інтерпретацію моделей, виведених виключно статистичними засо- бами з даних пасивних спостережень. Вони радять покладатися на рандомі- б 4 6 1 3 2 5 в 4 6 1 3 2 5 а 1 2 3 Рис. 5. Приклади неідентифікованості спрямування зв’язків Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 113 зовані експерименти або на апріорну інформацію. Питання з’ясовується че- рез аналіз та уточнення процедур. Обґрунтовану концепцію індуктивної каузальності першими, мабуть, запропонували Дж. Перл і Т. Верма [3, 6]. Як передумову для каузальної інтерпретації моделей на основі АОГ, вони сформулювали два загальних принципи (або вимоги до моделі): мінімальність та стабільність моделі. Пер- ша вимога відповідає відомому у філософії принципу «Леза Оккама». За умови адекватності простіша модель має перевагу, тому що легше піддаєть- ся поясненню та верифікації. Друга вимога забезпечує стійкість виведеної структури до варіювання параметрів. Відтак дістаємо визначення: змінна X має справжній каузальний вплив на ,Y тільки якщо в кожній мінімальній структурі моделі, узгодженій з даними, існує строго орієнтований шлях від X до .Y При цьому застережено спеціальні умови ідентифікації дуг вказа- ного шляху. Згідно з цими вимогами розроблено алгоритм IC*, який на ос- нові розподілення ймовірностей відтворює структуру моделі й ідентифікує дуги графу, які відображають «справжні» каузальні впливи (алгоритм мар- кує їх зірочкою). Алгоритм припускає існування латентних змінних, кожна з яких є кореневою та впливає лише на дві спостережувані змінні. У [3, 6] визначено умови, за яких можна розпізнати окремий «справж- ній» каузальний вплив між двома змінними в термінах впливу та незалеж- ності. Виходячи з цих умов, для випадку відсутності темпоральної інформа- ції пропонуємо строго формалізоване визначення паттерну каузального впливу (воно уточнює подане раніше в [18]). Для позначення того, що X та Y є залежні за фіксації умови S (розуміється, що S∉YX , ) введемо нота- цію ≡);;(Dep YX S ( )YX ;;Ind S¬ . Відтак пропонується таке статистичне (індуктивне) визначення. Визначення. Змінна X має справжній каузальний вплив на змінну ,Y якщо :)( SS ∉∃∃∃ XRZ );;(Ind{ RZ S & );;(Dep ZX S & );;(Dep RX S & & );;(Dep YX S & );;(ZDep YS & });;(ZInd YXS . (1) Каузальний вплив, виявлений через статистичний паттерн (1), може бу- ти безпосереднім або опосередкованим. Можливий випадок опосередкова- ного каузального впливу відображено на рис. 6 пунктиром. Каузальний зв’язок є безпосереднім (у контексті заданої множини змінних), якщо додат- ково виконується умова :),( QQ ∉∀ YX ).;;(Dep YX Q Для безпосереднього зв’язку можна сформулювати точніший критерій каузальності. Крім того, у три останні терми формули (1) не обов’язково має входити та сама множина S , що і в перші три терми. Зауважимо, що з огляду на припущення не- обманливості, визначення (1) містить надлишковий терм. Формулювання статистичного паттерну (1) переводить питання вери- фікації каузального відношення в процедуру тестування композитної ста- тистичної гіпотези. Таким чином, на основі симетричного поняття (не)залежності вдається ідентифікувати несиметричне відношення каузаль- ного впливу. Наведене визначення каузальності кореспондується з інтуїтив- ним розумінням. Зміст його можна передати так: « X є причиною для ,Y О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 114 якщо існує інструментальна (керуюча) змінна (можливо, «невидима», а її індикатором є Z ), і ця інструментальна змінна впливає на Y через посеред- ництво X ». У цьому формулюванні виділяються три ознаки: автономність (а відтак — спрямованість) керування інструментальної змінної; дієвість цього керування для ;Y умовна незалежність інструментальної змінної від Y за фіксації причини X . Нагадаємо, що терміни «керування» і «вплив» мають на думці спрямований зв’язок, а не просто кореляцію. Стверджувати про наявність строго орієнтованого шляху від X до Y в усіх мінімальних моделях, узгоджених із даними, можна тому, що такий оршлях з необхідніс- тю детермінується набором статистичних свідчень. Обґрунтування принципу ідентифікації каузального впливу. Мо- дель, зображена на рис. 6, підпадає під визначення каузального відношення (1), причому оршлях або дуга YX → є каузальними. Структура моделі на рис. 6 є спрощенням загального випадку (тому що множина S — пуста) і характеризується такими статистичними свідченнями: є тільки дві умовні незалежності );;(Ind YXZ , );;(Ind YXR і одна безумовна ){};;(Ind RZ . Зок- рема, чинна безумовна залежність ){};;(Dep YZ . Якщо прийняти згадану вище конвенцію про можливі механізми виник- нення залежностей, то залежність між X та Y може бути пояснена одним із трьох принципових припущень: змінна X каузально впливає на ;Y змінна Y каузально впливає на ;X X та Y обидві зазнають каузального впливу третьої змінної U (яка нерепрезентована в моде- лі), і, можливо, рівночасно діє один із двох перших механізмів. Для стверджен- ня, що X має каузальний вплив на ,Y достатньо спростувати (заперечити) усі альтернативні гіпотези. Нехай гіпотеза 0H — це твердження про існування оршляху від X до .Y При заданому в (1) наборі свідчень для гіпотези 0H потенційно існують чотири основні альтернативи: 1H , 2H , 3H , 4H , які відображені відповідно на рис. 7, а, 7, б, 7, в, 7, г. Можливі й інші екзотичніші альтернативи. Ці основні альтернативи породжуються з таких міркувань. Альтернати- ва каузальному впливові X на Y потребує або реверсу дуги (оршляху) YX → , або заміни її на дві дуги від прихованої змінної ,U або комбінації цих конструкцій. Однак реверс дуги між X та Y у структурі рис. 6 миттєво призводить до зникнення ланцюга (відкритого шляху) між Z та ,Y що су- перечить залежності ){};;(Dep YZ . Відтак в альтернативних моделях дове- деться вводити ребро Z — Y або відповідно ребра U — Y та Z — U , або X — .U Аналогічні ребра необхідні для змінної .R Отже, альтернативи поступаються з точки зору критерію простоти (додаються ребра та парамет- ри). Однак ще вагоміше заперечення викликає порушення принципу струк- турно-поведінкової адекватності. Дійсно, в усіх альтернативних структурах факти );;(Ind YXZ та );;(Ind YXR графічно незумовлені. Отож ми будемо змушені накладати вимоги на співвідношення параметрів, аби «мімікрува- ти» ці умовні незалежності. R Z YX Рис. 6. Паттерн каузального зв’язку Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 115 Розглянемо альтернативну гіпотезу 1H (рис. 7, а). Дані свідчать про );;(Ind YXZ , однак є ребро Z — .Y Для узгодження цих двох фактів має- мо вдатися до такого виправдання. За кондиціювання змінної X наводиться (провокується) [13, 16] «додаткова» залежність між її «батьками» Z та ,Y і більш того, ця провокована залежність між Z та Y точно нейтралізує почат- кову «реберну» залежність між Z та .Y Аналогічно, для виправдання факту );;(Ind YXR необхідна «анігіляція» ребра R — Y з провокованою залежні- стю між R та Y (через X ). Такі узгодження виглядають штучними (на- тяжка). Для гіпотези 2H (рис. 7, б) повторюються аналогічні міркування з тією відмінністю, що необхідно, аби «реберна» залежність між Z та Y точно «анігілювалася» з ланцюгом двох залежностей, який утворено з ребра U — Y та з наведеної залежності між Z та .U Для гіпотези 3H (рис. 7, в) для пояснення );;(Ind YXZ необхідний інший варіант «анігіляції» залежностей. Тут роль «нейтралізатора» для ребра Z — Y відіграє конструкція на основі чотирьох ребер з участю прихованої змінної .U Аналогічна «анігіляція» не- обхідна для виправдання факту );;(Ind YXR . Для гіпотези 4H (рис. 7, г) повторюється аргументація, викладена для гіпотези 1H , з тією відмінністю, що замість змінної Y підставляється .U Отже, усі моделі, що заперечують каузальний вплив X на ,Y непере- конливі з точки зору критичного раціоналізму, і тому мають бути відкинуті. Альтернативні гіпотези не лише потребують введення додаткових ребер, а ще й накладають жорсткі вимоги на співвідношення параметрів. Наукова методологія відкидає подібні натяжки (припущення ad hoc). Лише існування дуги YX → (або оршляху) забезпечує задовільне пояснення статистичних відношень у даних. Рис. 7. Альтернативні моделі для паттерну каузального зв’язку Z R X Y а U Z R X Y U Z R X Y U Z R X Y в б б О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 116 Можна помітити, що визначення (1) включає в себе умови колізорного та пост-колізорного правил. У той же час не всі ребра, які орієнтовано за допомогою колізорного правила, відповідають каузальним зв’язкам. Відпо- відно, не всі оршляхи моделі є каузальними. Ці семантичні відмінності можна синтаксично виразити в апараті графів частково-орієнтованих індук- ційних шляхів (POIPG) [1]. Потрібно зауважити, що за невеликого розміру відбірки даних визначення (1) на практиці може іноді призводити до поми- лок. Один із головних ризиків хибної ідентифікації каузального зв’язку по- ходить від ненадійності стандартного колізорного правила. Помилкова орієнтація ребер Z — X — R може відбутися у разі слабкості транзитної залежності між Z та .R Можна підвищити надійність колізорної орієнтації ребер за допомогою інструменту провокації (реактивації) залежності [13, 16]. Відповідно, для підвищення надійності ідентифікації каузальних відно- шень потрібно включити (додати) у формулювання (1) умову );;( Dep RXZ S , яка контрастує з умовою ).;;( Ind RZ S Можна сказати, що X «реактивує» залежність між Z та R (а у випадку пустої множини S — провокує залеж- ність). Така корекція визначення підвищить надійність виявлення каузаль- них відношень. ВИСНОВКИ Розглянена постановка задачі — виведення каузальних моделей з даних па- сивних спостережень — теоретично обтяжлива (потребує нестандартного мислення). Але саме така постановка відповідає практичним потребам і су- часним викликам. Зрозуміло, що нею не вичерпується методологія індук- тивного виводу (з емпіричних даних) моделей когнітивного призначення. Можливі й інші форми збору й аналізу емпіричних даних. З одного боку, репрезентація даних у формі єдиного сумісного розподілення ймовірностей змінних є спрощенням і обмеженням. Сукупність фактів умовної (і безумов- ної) незалежності не вичерпує змісту аналізованих даних. Зокрема, при цьо- му залишається не ужитим поняття стабільності каузальних параметрів крізь різні субдомени. З іншого боку, якщо розглядати структуру АОГ-моделі лише як форму репрезентації фактів умовної незалежності в розподіленні ймовірностей, то сумісне розподілення ймовірностей містить навіть надлиш- кову інформацію. Наприклад, маргінальні розподілення ймовірностей коре- невих змінних навряд чи несуть каузальну інформацію. Характеристика моделей як причинно-наслідкових (у загальнонауково- му розумінні цього терміна) — це питання інтерпретації моделі людиною. Будь-хто може не сприймати розглянені аргументи та запропонувати інші інтерпретації й інші дефініції. Та все ж видається, що наведене визначення каузального зв’язку вже самою своєю конструкцією схиляє до каузальної інтерпретації, а аргументація є концептуальною й узгодженою. Але, коли користувач збирається застосувати модель для прогнозу наслідків втручань в об’єкт, необхідно застерегти наступне. Потрібно ретельно порівняти умо- ви збору даних та умови планованих втручань. Якщо змінна керування не була репрезентована в даних, то для прогнозу наслідків керування доведеть- Від коваріацій до каузальності. Відкриття структур залежностей у даних Системні дослідження та інформаційні технології, 2011, № 4 117 ся зробити припущення про локальний і неруйнівний (для моделі) характер керування. Якість виведеної моделі зумовлюється повнотою набору змінних, роз- міром відбірки та точністю даних. Аналітик може опинитися не в змозі роз- пізнати реально існуюче каузальне відношення через те, що сформульова- ний вище індуктивно-статистичний Y-паттерн (1) не відшукується. Необхідна (але недостатня) передумова для виявлення цього паттерну — відсутність двох ребер у ближньому оточенні пари «причина – наслідок». Інша передумова — наявність індикатора інструментальної змінної. Більш того, якщо (під час збирання чи обробки) відбірку даних було піддано се- лекції за значенням певної змінної, яка є нащадком усіх інших змінних у моделі, то правдоподібно, що жодний зв’язок моделі не буде орієнтований, тобто напрямки впливів не ідентифікуються. Також у моделі з’являться зай- ві ребра. Цей ефект (провокування залежностей) відомий як selection bias, а також як парадокс Берксона [1, 3, 10]. Взагалі, якщо виведена модель вияви- лась недостатньо інформативною, то необхідно розширити номенклатуру спостережень, збільшити обсяг відбірки даних чи підвищити точність вимі- рювань. Методологія виведення каузальних моделей, що ґрунтується на систе- матичному аналізі статистичних відношень і на виявленні марківських влас- тивостей, на разі видається найбільш потужною та перспективною емпіри- ко-індуктивною методологією. Вона здатна настільки повно і точно ідентифікувати каузальні відношення, наскільки це дозволяють наявні дані спостережень. Виведення каузальних моделей із багатовимірних динаміч- них рядів даних ґрунтується на тих самих загальних принципах, але проце- дури виведення мають специфіку, зокрема, потрібне переформатування від- бірки даних («кейсізація»). Свіжий огляд літератури з каузального моделювання в економетриці на основі даних спостережень подано в [21]. ЛІТЕРАТУРА 1. Spirtes P., Glymour C. and Scheinеs R. Causation, prediction and search. — NY: MIT Press, 2001. — 543 p. 2. Scheines R., Spirtes P., Glymour C. et al. The TETRAD Project: Constraint based aids to causal model specification // Multivariate Behavioral Research. — 1998. — 33. — № 1. — P. 65–118. 3. Pearl J. CAUSALITY: models, reasoning, and inference. — Cambridge University Press, 2000. — 526 p. 4. Pearl J. Graphs, causality, and structural equation models // Sociological Methods and Research. — 1998. — 27. — № 2. — P. 226–284. 5. Spirtes P. A Tutorial on Causal Inference // Technical Report № CMU-PHIL-183. Dep. of Philosophy, August. — Carnegie Mellon University, PA. — 2009. — 68 p. 6. Pearl J., Verma T. A theory of inferred causation // Proceeding аnd International Conferences on Principles of Knowledge Representation and Reasoning. — Morgan Kaufmann, San Mateo, CA. — 1991. — P. 441–452. 7. Verma T., Pearl J. Equivalence and synthesis of causal models // The 6-th Annual Conference on Uncertainty in Artificial Intelligence. — Cambridge, MA, El- sevier Science Publishers. — 1991. — P. 220–227. О.С. Балабанов ISSN 1681–6048 System Research & Information Technologies, 2011, № 4 118 8. Glymour C. What s right with «Bayes Net Methods» and what is wrong with «Hunt- ing Causes and Using Them»? // British Journal for the Philosophy of Science. — 2010. — 61. — № 1. — P. 161–211. 9. Pearl J. Review of N. Cartwright «Hunting Causes and Using Them» // Economics and Philosophy. — 2010. — 26. — № 1. — P. 69–77. 10. Richardson T. and Spirtes P. Causal Inference via ancestral graph Markov models // Highly Structured Stochastic Systems. — Oxford University Press, 2003. — P. 83–105. 11. Балабанов А.С. Минимальные сепараторы в структурах зависимостей. Свойст- ва и идентификация // Кибернетика и системный анализ. — 2008. — № 6. — С. 17–32. 12. Андон Ф.И., Балабанов А.С. Структурные статистические модели: инструмент познания и моделирования // Системні дослідження та інформаційні техно- логії. — 2007. — № 1. — С. 79–98. 13. Балабанов A.C. К выводу структур моделей вероятностных зависимостей из статистических данных // Кибернетика и системный анализ. — 2005. — № 5. — С. 19–31. 14. Chow C.K., Liu C.N. Approximating discrete probability distributions with de- pendence trees // Institute of Electrical and Electronics Engineers transactions on Information Theory. — 1968. — 14. — № 3. — P. 462–467. 15. Балабанов О.С. Індуктивне відтворення деревовидних структур систем залеж- ностей // Проблемы программирования. — 2001. — № 1/2. — С. 95–108. 16. Балабанов А.С. Реконструкция модели вероятностных зависимостей по стати- стическим данным. Инструментарий и алгоритм // Проблемы управления и информатики. — 2009. — № 6. — С. 90–103. 17. Балабанов О.С. Системи ймовірнісних залежностей: графові та статистичні властивості // Математичні машини та системи. — 2009. — № 3. — С. 80–97. 18. Балабанов О.С. Відкриття структур залежностей в даних: від непрямих асо- ціацій до каузальності // Материалы 3-й междунар. конф. «УкрПРОГ’2002». Проблемы программирования. — 2002. — № 1/2. — С. 309–316. 19. Андон П.І., Балабанов О.С. До відкриття латентного бінарного фактора в ста- тистичних даних категорного типа // Доп. НАН України. — 2008. — № 9. — С. 37–43. 20. Elidan G., Lotner N., Friedman N. and Koller D. Discovering hidden variables: A structure-based approach // Proceedings of the 13-th Conferences on Advances in Neural Information Processing Systems (NIPS-2000). — Denver, Colorado. — 2000. — P. 479–485. 21. Kwon D.-H., Bessler D.A. Graphical Methods, Inductive Causal Inference, and Econometrics: A Literature Review // Computational Economics. — 2011. — 38. — № 1. — Р. 85–106. Надійшла 22.04.2010