Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності
У роботі розроблено та програмно реалізовано метод індукції дерева рішень для задачі класифікації політравм на основі ряду біохімічних показників. Вивчаються питання обчислювальної складності алгоритму. Проект реалізований в середовищі Netbeans на основі Java-класів....
Gespeichert in:
Datum: | 2014 |
---|---|
Hauptverfasser: | , |
Format: | Artikel |
Sprache: | Ukrainian |
Veröffentlicht: |
Інститут проблем штучного інтелекту МОН України та НАН України
2014
|
Schriftenreihe: | Искусственный интеллект |
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/85298 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності / І.Є. Андрущак, Ю.С. Повстяна // Искусственный интеллект. — 2014. — № 2. — С. 100–106. — Бібліогр.: 13 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-85298 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-852982015-07-25T03:01:37Z Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності Андрущак, І.Є. Повстяна, Ю.С. Интеллектуальные системы планирования, управления, моделирования и принятия решений У роботі розроблено та програмно реалізовано метод індукції дерева рішень для задачі класифікації політравм на основі ряду біохімічних показників. Вивчаються питання обчислювальної складності алгоритму. Проект реалізований в середовищі Netbeans на основі Java-класів. В работе разработан и программно-реализован метод индукции дерева решений для задачи классификации политравм на основе ряда биохимических показателей. Изучаются вопросы вычислительной сложности алгоритма. Проект реализован в среде Netbeans на основе Java-классов. In this work was developed and implemented a method of inducing decision trees for classification problem polytrauma based on a number of biochemical parameters. The problems of computational complexity of the algorithm. The project was implemented in an environment based on Netbeans Java-classes. 2014 Article Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності / І.Є. Андрущак, Ю.С. Повстяна // Искусственный интеллект. — 2014. — № 2. — С. 100–106. — Бібліогр.: 13 назв. — укр. 1561-5359 http://dspace.nbuv.gov.ua/handle/123456789/85298 61:004.651(075.8) uk Искусственный интеллект Інститут проблем штучного інтелекту МОН України та НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Ukrainian |
topic |
Интеллектуальные системы планирования, управления, моделирования и принятия решений Интеллектуальные системы планирования, управления, моделирования и принятия решений |
spellingShingle |
Интеллектуальные системы планирования, управления, моделирования и принятия решений Интеллектуальные системы планирования, управления, моделирования и принятия решений Андрущак, І.Є. Повстяна, Ю.С. Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності Искусственный интеллект |
description |
У роботі розроблено та програмно реалізовано метод індукції дерева рішень для задачі класифікації
політравм на основі ряду біохімічних показників. Вивчаються питання обчислювальної складності
алгоритму. Проект реалізований в середовищі Netbeans на основі Java-класів. |
format |
Article |
author |
Андрущак, І.Є. Повстяна, Ю.С. |
author_facet |
Андрущак, І.Є. Повстяна, Ю.С. |
author_sort |
Андрущак, І.Є. |
title |
Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності |
title_short |
Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності |
title_full |
Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності |
title_fullStr |
Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності |
title_full_unstemmed |
Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності |
title_sort |
програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності |
publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
publishDate |
2014 |
topic_facet |
Интеллектуальные системы планирования, управления, моделирования и принятия решений |
url |
http://dspace.nbuv.gov.ua/handle/123456789/85298 |
citation_txt |
Програмна реалізація методу індукції дерева рішень для класифікації політравм: питання обчислюваної складності / І.Є. Андрущак, Ю.С. Повстяна // Искусственный интеллект. — 2014. — № 2. — С. 100–106. — Бібліогр.: 13 назв. — укр. |
series |
Искусственный интеллект |
work_keys_str_mv |
AT andruŝakíê programnarealízacíâmetoduíndukcííderevaríšenʹdlâklasifíkacíípolítravmpitannâobčislûvanoískladností AT povstânaûs programnarealízacíâmetoduíndukcííderevaríšenʹdlâklasifíkacíípolítravmpitannâobčislûvanoískladností |
first_indexed |
2025-07-06T12:30:30Z |
last_indexed |
2025-07-06T12:30:30Z |
_version_ |
1836900712121892864 |
fulltext |
ISSN 1561-5359 «Искусственный интеллект» 2014 № 2 100
4А
УДК 61:004.651(075.8)
І.Є. Андрущак, Ю.С. Повстяна
Луцький національний технічний університет, Україна
Україна, 43000, м. Луцьк, вул.Львівська, 75
Програмна реалізація методу індукції
дерева рішень для класифікації політравм:
питання обчислюваної складності
I.Ye. Andruschak, Y.S. Povstiana
Lutsk Natіonal Technіcal Unіversity, Ukraine
Ukraine, 43000, Lutsk, Lvіvska st. 75
Software Implementation By Induction of Decision Trees
for Classification Of Polytrauma: Computational Complexity
И.Е. Андрущак, Ю.С. Повстяная
Луцкий национальный технический университет, Украина
Украина, 43000, г. Луцьк, ул. Львовская, 75
Программная реализация метода индукции
дерева решений для классификации политравм:
вопросы вычислительной сложности
В работе разработан и программно-реализован метод индукции дерева решений для задачи классификации
политравм на основе ряда биохимических показателей. Изучаются вопросы вычислительной сложности
алгоритма. Проект реализован в среде Netbeans на основе Java-классов.
Ключевые слова: политравма, принятия решений, дерево решений, Java, SQL.
In this work was developed and implemented a method of inducing decision trees for classification problem
polytrauma based on a number of biochemical parameters. The problems of computational complexity of the
algorithm. The project was implemented in an environment based on Netbeans Java-classes.
Keywords: polytrauma, decision-making, decision tree, Java, SQL.
У роботі розроблено та програмно реалізовано метод індукції дерева рішень для задачі класифікації
політравм на основі ряду біохімічних показників. Вивчаються питання обчислювальної складності
алгоритму. Проект реалізований в середовищі Netbeans на основі Java-класів.
Ключові слова: політравма, прийняття рішень, дерево рішень, Java, SQL.
Вступ
Під політравмою мають на увазі складний патологічний процес, зумовлений по-
шкодженням кількох анатомічних областей або сегментів кінцівок. Проблему становить
правильне та своєчасне діагностування політравм, особливо в умовах надзвичай-
них ситуацій або військових дій, коли пацієнт знаходиться у стані без свідомості.
Метою даної роботи є розробити і програмно реалізувати алгоритм класифі-
кації політравм з використанням методу індукції дерева рішень, вивчити питання його
обчислювальної складності. Вирішувана проблема належить до широкого класу задач
диференціальної діагностики. В медицині поняття «диференціальної діагностики»
означає системний підхід, що грунтується на доказовості, для визначення причини сим-
птомів, що спостерігаються, у випадку, коли є кілька альтернативних пояснень, а також
для зменшення переліку можливих діагнозів.
Програмна реалізація методу індукції дерева рішень для класифікації політравм...
«Штучний інтелект» 2014 № 2 101
4А
Одним з підходів, що відображає природній процес мислення при диференціальній
діагностиці, є метод індукції дерева рішень. У попередніх наших дослідженнях даний ал-
горитм було описано та програмно реалізовано в середовищі Netbeans для бази даних
MySQL. Інтерес викликає проблема обчислювальної складності алгоритму для реальних
клінічних даних – таких, як наприклад, дані біохімічних досліджень у випадку політравм.
Програмна реалізація. Метод реалізовано в середовищі розробки Netbeans на
мові програмування Java. Базу навчальних даних розгорнуто на сервері MySQL. На рис. 1
представлено концептуальну модель інформаційної системи. У класі DecisionTree без-
посередньо реалізовано метод індукції дерева рішень. У клас DataManager надходять
виклики від DecisionTree на виконання запитів до бази даних mysql щодо отримання
навчальних даних.
Клас DecisionTree
Менеджер даних
DataManager
Слуги (пери) по
обслуговуванню запитів
від менеджера даних
База даних
mysql
Рисунок 1 – Концептуальна модель інформаційної системи індукції дерева рішень
База даних mysql складається з двох таблиць – таблиці attribute, призначеної для
зберігання інформації про атрибути та таблиці categorized_data – для наборів навчальних
даних. Структура таблиць на мові SQL для класифікації політравм наведена нижче:
CREATE TABLE mysql.attribute (
id integer not null unique,
attribute_name varchar(25),
attribute_field_name varchar(25),
primary key (id)
) ENGINE=InnoDB;
CREATE TABLE mysql.categorised_data (
id integer not null unique,
A1 varchar(12),
A2 varchar(8),
A3 varchar(7),
…………………..
A21 varchar(7),
class varchar(28),
primary key (id)
) ENGINE=InnoDB;
Андрущак І.Є., Повстяна Ю.С.
«Искусственный интеллект» 2014 № 2 102
4А
В
Програмні класи проекту включено до пакету decision_tree.model. Сюди входять
beans-класи Attribute, Attribute_for_list та CategorisedData для роботи з даними відповід-
них таблиць. SQL-запити щодо отримання відповідних даних, включаючи розрахунки
інформаційних показників реалізовано в класі AttributeListPeer.
Клас DecisionTree є нащадком класу DefaultTreeModel пакету javax.swing.tree.
Він має два елементи класу: m_dataManager – менеджер даних та m_htAttribute_list –
хеш-таблиця із списком атрибутів. Хеш-таблиця із списком атрибутів (у методах класу
DecisionTree виступає під назвою htAttribute_list) створюється для кожного вузла
дерева рішень. Вона має два призначення – поряд із списком включених для даного
вузла атрибутів зберігати умови поділу (splitting conditions), які перейшли до даного
вузла від вузлів-батьків. Кожен вузол дерева рішень є об’єктом класу Default-
MutableTreeNode. В якості об’єкта кожен вузол зберігає об’єкт класу NodeObject, де-
кларація якого наведена нижче:
class NodeObject {
Attribute attribute;
Hashtable htAttribute_list;
String splitting_criterion;
String sLabel;
public String toString() {
if (splitting_criterion.matches("")) { return sLabel; }
else return "if '" + splitting_criterion + "' then '" + sLabel + "'"; }
}
Тут attribute – атрибут, який повертається методом Attribute_selection_method,
splitting_criterion – умова поділу, яка переходить від батьківського вузла, sLabel –
надпис на вузлі. Хеш-таблиця htAttribute_list використовується для побудови наборів
навчальних даних jD для кожного із вузлів і має таку структуру:
Тип ключа int
Тип об’єкта Attribute_for_list
Структура об’єкта Attribute attribute;
Hashtable htSplitting_outcomes;
String splitting_criterion;
boolean included;
Тут included – булева змінна-прапорець належності атрибуту attribute до списку
атрибутів даного вузла. Можна показати, що коли included=true, то вузол з назвою
attribute є для даного вузла дочірнім (на певному нижчому рівні ієрархії). У випадку,
коли атрибут attribute не входить до списку атрибутів для даного вузла (included=false), то
вузол з назвою attribute є батьківським (на певному рівні ієрархії), а в змінній
splitting_criterion зберігається умова поділу, якій підлягає даний вузол відносно батьків-
ського вузла attribute.
Хеш-таблиця htSplitting_outcomes містить усі можливі наслідки (умови
поділу) щодо атрибуту attribute.
Метод Generate_decision_tree є безпосередньою реалізацією методу індукції
дерева рішень. Заголовок методу має вигляд:
private DefaultMutableTreeNode Generate_decision_tree (Hashtable htAttribute_list,
DefaultMutableTreeNode dmtnSubroot, String splitting_criterion)
В якості аргументів метод використовує кореневий вузол дерева, список
пов’язаних з ним атрибутів htAttribute_list та умову поділу splitting_criterion. В якості
значення метод повертає дочірній вузол типу DefaultMutableTreeNode. Шляхом ре-
курсивного виклику методу Generate_decision_tree будується дерево рішень.
Програмна реалізація методу індукції дерева рішень для класифікації політравм...
«Штучний інтелект» 2014 № 2 103
4А
З метою візуалізації представлення дерева використано клас javax.swing.JTree. При
цьому дерево рішень створюється за допомогою операторів:
dtDecision_tree = new DecisionTree(dmtnRoot, dataManager, htAttribute_list);
jTree1.setModel(dtDecision_tree);
SQL-реалізація розрахунку інформаційних показників. Далі за допомогою
розроблених програмних класів побудуємо дерево рішень щодо класифікації
політравм на основі даних 6-ти класифікаційних груп, а саме:
черепно-мозкова та скелетна травми мали місце 2 години тому;
черепно-мозкова та скелетна травми з кровотечею мали місце 2 години тому;
черепно-мозкова та скелетна травми мали місце 12 годин тому;
черепно-мозкова та скелетна травми з кровотечею мали місце 12 годин тому;
черепно-мозкова та скелетна травми мали місце 24 години тому;
черепно-мозкова та скелетна травми з кровотечею мали місце 24 години тому.
Використано таку таблицю атрибутів:
INSERT INTO mysql.attribute (id, attribute_name, attribute_field_name) VALUES
(1, 'Mass', 'A1'), (2, 'Total.bil.', 'A2'), (3, 'AsAT', 'A3'), (4, 'AlAT', 'A4'), (5, 'GP', 'A5'), (6,
'GR', 'A6'), (7, 'VG', 'A7'), (8, 'SOD', 'A8'), (9, 'Catalaza', 'A9'), (10, 'MDA', 'A10'), (11, 'DK', 'A11'),
(12, 'TsP', 'A12'), (13, 'TsIK', 'A13'), (14, 'API', 'A14'), (15, 'Ig A', 'A15'), (16, 'Ig M', 'A16'), (17, 'Ig
G', 'A17'), (18, 'Il-2', 'A18'), (19, 'Il-6', 'A19'), (20, 'Il-10', 'A20'), (21, 'TNF-a', 'A21');
Набори включають лише категоріальні дані (попередньо оброблені), наприклад:
INSERT INTO mysql.categorised_data (id, A1, A2, A3, A4, A5, A6, A7, A8, A9,
A10, A11, A12, A13, A14, A15, A16, A17, A18, A19, A20, A21, class) VALUES
(1, 'low', 'low', 'high', 'high', 'normal', 'low', 'low', 'low', 'low', 'high', 'high', 'high',
'high', 'low', 'high', 'high', 'high', 'high', 'high', 'high', 'high',
'craniocerebral_injury+orthopedic_trauma_2_hours');
Проблема обчислювальної складності алгоритму індукції дерева рішень. Як
вказано в роботі [Han, 2001], час виконання алгоритму індукції дерева рішень оцінюєть-
ся величиною:
)))(log(#)(#( DDpO . (4)
Тому нашою метою є підтвердити вищенаведений результат експериментально.
Експеримент провели змінюючи кількість атрибутів p . Дерева рішень побудовані для
кожного значення p .
Таблиця 1 – Залежність часу індукції дерева рішень від кількості атрибутів p
(алгоритм на основі приросту інформації)
p Час індукції дерева рішень, мс
1 122
2 252
3 392
4 450
5 550
6 762
7 820
8 900
9 1030
10 1080
11 1238
12 1282
Андрущак І.Є., Повстяна Ю.С.
«Искусственный интеллект» 2014 № 2 104
4А
В
Продолж. табл. 1
p Час індукції дерева рішень, мс
13 1342
14 1424
15 1885
16 1402
17 1502
18 1585
19 2110
20 2212
21 3033
Таблиця 2 – Залежність часу індукції дерева рішень від кількості атрибутів p
(алгоритм на основі відношення приростів інформації)
p Час індукції дерева рішень, мс
1 100
2 290
3 610
4 740
5 832
6 930
7 1002
8 1242
9 1321
10 1472
11 1623
12 1724
13 1847
14 1981
15 2092
16 2595
17 1390
18 3033
19 2652
20 5096
21 5380
На рис.2 і 3 наведені оцінки часу індукції дерева рішень згідно (4).
Оцінка складності алгоритму на основі приросту інформації
0
500
1000
1500
2000
2500
3000
3500
1 3 5 7 9 11 13 15 17 19 21
Кількість атрибутів, p
Ча
с,
м
с Час індукції дерева рішень
Оцінка часу індукції дерева
рішень
Рисунок 2
Програмна реалізація методу індукції дерева рішень для класифікації політравм...
«Штучний інтелект» 2014 № 2 105
4А
Оцінка складності алгоритму на основі відношення приростів
інформації
0
1000
2000
3000
4000
5000
6000
1 3 5 7 9 11 13 15 17 19 21
Кількість атрибутів, p
Ча
с,
м
с Час індукції дерева рішень
Оцінка часу індукції дерева
рішень
Рисунок 3
Список літератури
1. Соколов В.А. Множественные и сочетанные травмы / Соколов В.А. – ГЭОТАР, 2006г.
2. Han J. Data Mining: Concepts and Techniques / J. Han and M. Kamber – Morgan Kaufmann, San
Francisco, 2001. – [1st ed.]
3. Hastie T. The Elements of Statistical Learning / T. Hastie, R. Tibshirani and J.H. Friedman. – Springer,
New York, 2001. – [1st ed.]
4. C.Ordonez, Comparing association rules and decision trees for disease prediction / C.Ordonez // Proc.
ACM HIKM Workshop. – 2006. – P. 17-24.
5. Ordonez C. Integrating K-means clustering with a relational DBMS using SQL / C.Ordonez // IEEE
Transactions on Knowledge and Data Engineering (TKDE). – 2006. – № 18(2). – P. 188-201.
6. Quinlan J.R. Induction of decision trees / J.R.Quinlan // Machine Learning. – 1986. – № 1. – P. 81-106.
7. Quinlan J.R. C4.5: Programs for Machine Learning / J.R.Quinlan. – Morgan Kaufmann, 1993.
8. Classification and Regression Trees / [L. Breiman, J. Friedman, R. Olshen, and C. Stone]. – Wadsworth
International Group, 1984.
9. Марценюк В.П. О программной среде проектирования интеллектуальных баз данных / В.П. Марценюк,
Н.О. Кравец // Клиническая информатика и телемедицина – 2004. – № 1. – С. 47-53.
10. Марценюк В.П. Математичні моделі в системі підтримки прийняття рішень страхового забезпечення
лікування онкологічних захворювань: підхід на основі динаміки Гомперца / В.П. Марценюк,
І.Є. Андрущак, І.С. Гвоздецька, Н.Я. Климук // Доповіді Національної академії наук України. – 2012. –
№ 10. – С. 34-39.
11. Марценюк В.П. Підхід на основі актуарних математичних моделей до задач страхової медицини /
В. П. Марценюк, І.Є. Андрущак, Н.Я Климук // Медична інформатика та інженерія. Науково-
практичний журнал. – 2010. – № 4. – С. 85-87.
12. Марценюк В.П. О модели онкологического заболевания со временем пребывания на стадии в
соответствии с распределением Гомперца / В.П. Марценюк, Н.Я. Климук // Проблемы управления
и информатики. Международный научно-технический журнал . – 2012. – № 6. – С. 137-143.
13. Марценюк В.П. Медична інформатика. Інструментальні та експертні системи / В.П. Марценюк ,
А.В. Семенець. – Тернопіль : Укрмедкнига, 2004. – 222 с.
References
1. Multiple and combined injuries – V.A. Sokolov, "GEOTAR" 2006.2. J..Han and M.Kamber, Data
Mining: Concepts and Techniques, Morgan Kaufmann, San Francisco, 1st edition, 2001.
3. T.Hastie, R.Tibshirani and J.H.Friedman, The Elements of Statistical Learning, Springer, New York, 1st
edition, 2001.
4. C.Ordonez, Comparing association rules and decision trees for disease prediction, In Proc. ACM HIKM
Workshop, 2006, pp. 17-24.
5. C.Ordonez, Integrating K-means clustering with a relational DBMS using SQL, IEEE Transactions on
Knowledge and Data Engineering (TKDE) 18(2) (2006), 188-201.
Андрущак І.Є., Повстяна Ю.С.
«Искусственный интеллект» 2014 № 2 106
4А
В
6. J.R.Quinlan. Induction of decision trees. Machine Learning, 1: 81-106, 1986.
7. J.R.Quinlan. C4.5: Programs for Machine Learning. Morgan Kaufmann, 1993.
8. L.Breiman, J.Friedman, R.Olshen, and C.Stone. Classification and Regression Trees. Wadsworth
International Group, 1984.
9. Martsenuk V.P., Kravets N.O. About the software environment of intelligent database / / Clinical
informatics and telemedicine – 2004. – № 1. – P.47-53.
10. Martsenuk V.P. Matematichnі modelі in sistemі pіdtrimki of acceptance rіshen insurance zabezpechennya
lіkuvannya onkologіchnih zahvoryuvan: pіdhіd on osnovі dinamіki Gompertz / V.P. Martsenyuk, І.Ye.
Andrushchak, І.S. Gvozdetska, N.Y. Klymuk / / Dopovіdі Natsіonalnoї akademії Sciences of Ukraine. –
2012. – № 10. – Pp. 34-39.
11. Martsenuk V.P. Pіdhіd on mathe osnovі actuarial models to problems strahovoї Medical / V.P.
Martsenyuk, І.Ye. Andrushchak, N.Ya. Klymuk / / Medichna іnformatika that іnzhenerіya. Naukovyi
impractical magazine. – 2010. – № 4. – S. 85-87.
12. Martsenuk V.P. On the model of cancer with a residence time on the stage, in accordance with the
distribution of the Gompertz / V.P. Martsenyuk, N.Y. Klymuk / / Control and Informatics. International
Science and Technology magazine. – 2012. – № 6. – S. 137-143.
13. Martsenuk V.P., A.V. Semenets Medichna іnformatika. Іnstrumentalnі that ekspertnі system. – Ternopil:
Ukrmedkniga 2004. – 222.
RESUME
I.Ye. Andruschak, Y.S. Povstiana
Software Implementation By Induction of Decision Trees
for Classification of Polytrauma: Computational Complexity
We consider the issue of development and program implementation of decision tree
induction based on the information provided to construct a classification algorithm trauma.
Exploring in this example, the issue of computational complexity of decision tree
induction algorithm found that:
Time induction of decision tree based on the information provided is well
approximated estimate (4) with a small number of attributes (in this case - to 15-16);
With the number of attributes (in this case more than 15-16) while inducing
decision trees, regardless of the choice of information measure attribute begins to deviate
significantly from the estimates (4);
With a small number of attributes induced by the decision tree constructed on the
basis of growth rate information, or the ratio of growth are identical - that is, information
measure, which is the basis of selection division attribute has no effect on the induced
decision tree.
Prospects of this research is to analyze the performance of the software, depending
on the amount of training data sets.
Стаття надійшла до редакції 05.04.2014.
|