Метод построения и использования семантических моделей для мониторинга общественного мнения

Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информац...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Datum:2018
Hauptverfasser: Додонов, А.Г., Ландэ, Д.В., Березин, Б.А.
Format: Artikel
Sprache:Russian
Veröffentlicht: Інститут проблем реєстрації інформації НАН України 2018
Schriftenreihe:Реєстрація, зберігання і обробка даних
Schlagworte:
Online Zugang:http://dspace.nbuv.gov.ua/handle/123456789/169072
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
Назва журналу:Digital Library of Periodicals of National Academy of Sciences of Ukraine
Zitieren:Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос.

Institution

Digital Library of Periodicals of National Academy of Sciences of Ukraine
id irk-123456789-169072
record_format dspace
spelling irk-123456789-1690722020-06-04T01:26:32Z Метод построения и использования семантических моделей для мониторинга общественного мнения Додонов, А.Г. Ландэ, Д.В. Березин, Б.А. Інформаційно-аналітичні системи обробки даних Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информации, содержащейся в текстах из сети Интернет. Предложена процедура мониторинга общественного мнения, которая включает три этапа: построение и кластеризацию; отбор документов и определение тональности тематик; визуализацию результатов. Показано построение семантических моделей, применение методов кластерного анализа для определения актуальных тематик, оценивание доли и тональности отдельных подтем в составе общего тематического потока информации. Полученные результаты подтверждают возможность использования предложенного метода мониторинга общественного мнения в различных предметных областях. Запропоновано метод побудови та використання семантичних моделей (СМ) з метою безперервного в часі моніторингу громадської думки (МГД). Під семантичною моделлю в рамках даної роботи розуміється модель предметної області, що має вигляд орієнтованого графа, вершини якого відповідають концептам предметної області, а дуги задають відносини між ними. Семантичні моделі дозволяють використовувати при моніторингу громадської думки результати лінгвостатистичного аналізу текстів (Text Mining), застосування методів екстрагування інформації (Information Extraction), що містяться в текстах з мережі Інтернет. У той час, як існуючі проекти аналізу громадської думки більше орієнтовані на разові (статичні) дослідження громадської думки щодо об’єктів і явищ, запропоновано метод автоматизованої побудови та використання СМ на основі безперервного в часі моніторингу громадської думки в мережі Інтернет. Процедура МГД включає три етапи: побудову та кластеризацію СМ; відбір документів і визначення тональності тематик; візуалізацію результатів. Показано побудову СМ за допомогою алгоритму компактифікованого графа горизонтальній видимості, застосування методів кластерного аналізу для визначення актуальних тематик, оцінювання частки та тональності окремих підтем у складі загального тематичного потоку інформації. Як приклади розглянуто моделі предметних областей, що відповідають темам: «One Belt, One Road», «Nord Stream», «Генетично модифіковані організми». Отримані результати підтверджують можливість використання запропонованого методу моніторингу громадської думки у різних предметних областях. It is proposed a method for constructing and using semantic models (SM) for the purpose of continuous monitoring of public opinion, opinion mining (OM). Under the semantic model in the framework of this work, it is implied the subject domain model, which has the form of a directed graph, the vertices of which correspond to the concepts of the domain, and the arcs define the relations between them. Semantic models make it possible to use the results of linguistic statistical analysis of texts (Text Mining) and the use of Information Extraction methods contained in texts from the Internet for opinion mining. While the existing public opinion analysis projects are more focused on one-time (static) public opinion research on objects and phenomena, it is proposed a method for automated construction and use of SM based on continuous monitoring of public opinion on the Internet. The OM procedure consists of three steps: the construction and clustering of the SM; selection of documents and the sentiment definition of topics; visualization of results. The SM construction using the compactified horizontal visibility graph algorithm, the use of cluster analysis methods for determining relevant topics, estimating the proportion and tonality of individual sub-themes in the overall thematic information flow is shown. As examples, the models of subject areas corresponding to the topics: «One Belt, One Road», «Nord Stream», «Genetically Modified Organisms» are examined. The obtained results confirm the possibility of using the proposed method of opinion monitoring in various subject areas. 2018 Article Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос. DOI: https://doi.org/10.35681/1560-9189.2018.20.4.178928 1560-9189 http://dspace.nbuv.gov.ua/handle/123456789/169072 004.421 ru Реєстрація, зберігання і обробка даних Інститут проблем реєстрації інформації НАН України
institution Digital Library of Periodicals of National Academy of Sciences of Ukraine
collection DSpace DC
language Russian
topic Інформаційно-аналітичні системи обробки даних
Інформаційно-аналітичні системи обробки даних
spellingShingle Інформаційно-аналітичні системи обробки даних
Інформаційно-аналітичні системи обробки даних
Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
Метод построения и использования семантических моделей для мониторинга общественного мнения
Реєстрація, зберігання і обробка даних
description Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информации, содержащейся в текстах из сети Интернет. Предложена процедура мониторинга общественного мнения, которая включает три этапа: построение и кластеризацию; отбор документов и определение тональности тематик; визуализацию результатов. Показано построение семантических моделей, применение методов кластерного анализа для определения актуальных тематик, оценивание доли и тональности отдельных подтем в составе общего тематического потока информации. Полученные результаты подтверждают возможность использования предложенного метода мониторинга общественного мнения в различных предметных областях.
format Article
author Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
author_facet Додонов, А.Г.
Ландэ, Д.В.
Березин, Б.А.
author_sort Додонов, А.Г.
title Метод построения и использования семантических моделей для мониторинга общественного мнения
title_short Метод построения и использования семантических моделей для мониторинга общественного мнения
title_full Метод построения и использования семантических моделей для мониторинга общественного мнения
title_fullStr Метод построения и использования семантических моделей для мониторинга общественного мнения
title_full_unstemmed Метод построения и использования семантических моделей для мониторинга общественного мнения
title_sort метод построения и использования семантических моделей для мониторинга общественного мнения
publisher Інститут проблем реєстрації інформації НАН України
publishDate 2018
topic_facet Інформаційно-аналітичні системи обробки даних
url http://dspace.nbuv.gov.ua/handle/123456789/169072
citation_txt Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос.
series Реєстрація, зберігання і обробка даних
work_keys_str_mv AT dodonovag metodpostroeniâiispolʹzovaniâsemantičeskihmodelejdlâmonitoringaobŝestvennogomneniâ
AT landédv metodpostroeniâiispolʹzovaniâsemantičeskihmodelejdlâmonitoringaobŝestvennogomneniâ
AT berezinba metodpostroeniâiispolʹzovaniâsemantičeskihmodelejdlâmonitoringaobŝestvennogomneniâ
first_indexed 2025-07-15T03:48:46Z
last_indexed 2025-07-15T03:48:46Z
_version_ 1837683260164931584
fulltext - ISSN 1560-9189 , , 2018, . 20, 4 53 004.421 . . , . . , . . . . , 2, 03113 , - . - , , - . , : ; - ; . - , , - - . - - . : , , , , - , - . ( ) , , , . , , , . . - - . , , - , - © . . , . . , . . . . , . . , . . 54 - - , . . - - (Text Mining), (Information Ext- raction), . ( - ) , - - . - (Natural Lan- guage Processing). . ( , ). , , , (Sentiment Analysis — SA, Opinion Mining — OM) , - , , , - , [1, 2]. : , , . , - , , ( , . .) . , . - , , . [3] - - , , . - Google, Google News, - , . . , - . , , . [4] Youtube. - . Youtube - . - . - . , ISSN 1560-9189 , , 2018, . 20, 4 55 . [5] 2012 . , . - 81 . 400 - . « - - » , , . . - - . - ( ) , - [6]: — ; — ; — . : — ; — ; - [7]; — ; — , ( - ). : — , ( ), ; — ; — . : — ; — ( ) . , . . . . . - , , - , - . ( - ). , , , TFIDF , - , [8]. . . , . . , . . 56 - . - - ( ) [7], . 1. , - , ( — ). 2. . - , « », . . , . 3. . , . - . , - . . , , , -2, - . , 28 - OBOR , . 1. . 1. 28 OBOR . - , — (clastering graph, community detection). [9] , . ISSN 1560-9189 , , 2018, . 20, 4 57 - - - . [9] , ( - ). - . , - , Louvain, Leading igenvector, Walktrap. - Louvain [10], - . . , . - , - , , . - , - . : , - - . , . Leading Eigenvector [11] - . , , . , , . . Walktrap [9], ( ) . - , , , . , . , . , , - («One Belt, One Road» — OBOR) - , . 1. , . - - , , . . . , - , , . - - , , , . OBOR, , - , . 2. , - . . , . . , . . 58 ( ), , . . . , , - , , . . , - InfoStream (one-road)&(one-belt)&china, OBOR, . 2. , , . 3. . — , , - , , . , - [5]. - , - , , - , , , . . - : - , , , , ( , « - » ). , - OBOR, . 3. . - . - . - , , - , - ( . 3, . 2). : , - ; ; - , . - - . ( ) OBOR . 3–5. , - Gephi (http://gephi.org), , R. . http://gephi.org ISSN 1560-9189 , , 2018, . 20, 4 59 . 2. . - - - : One Belt, One Road (OBOR) — « » « - XXI »; Nord Stream — ; GMO — - . OBOR - 1000 ( 30.11.2018 25.07.2018), - (one-road)&(one-belt)&china - InfoStream. , , ( , TFIDF) ( . 1). , Louvain, Leading Eigenvector Walktrap , . 1. . 1 , - . 1, 2 — - , , , 3–5 — , , TFIDF. - - , - . , - . . , . . , . . 60 - , , , - ( . 2). 1. , OBOR Louvain Walktrap Louvain (TFIDF) Walktrap (TFIDF) Leading eigenvector (TFIDF) economy military world countries country state global war trade projects economic cooperation security political infrastructure investment development international support national india military power pakistan country us strategic might russia american political iran russian defense syria turkey india world relations war united states russia japan think iran defense syria chinese president people government market xi business million debt including beijing billion summit leaders sri chinese president people government projects xi debt trump project investment cpec billion port bri sri chinese president obor people government projects xi cooperation debt project investment beijing summit port bri india china south asia power region pakistan relations influence us strategic east europe russia american trump japan africa part sea south region relations indian xinjiang economic cooperation africa development beijing summit pacific taiwan china's military south power region state global strategic might economic american security political africa research uighur pacific taiwan prime minister foreign policy prime minister foreign prime minister foreign japanese abe mahathir malaysia prime minister japanese abe mahathir malaysia prime minister foreign japanese abe mahathir russian china's road belt initiative project silk road belt initiative silk china's global obor market research 2. , , 1 xi projects investment ( ) bri 2 india pakistan us , , 3 south region development 4 japan minister abe ISSN 1560-9189 , , 2018, . 20, 4 61 , , - , . 3. , - OBOR. 3. «OBOR» xi projects investment 10,1 % (101) 2 % (2) 0 98 % (99) japan minister abe 9,2 % (92) 1 % (1) 0 99 % (91) india pakistan us 8 % (80) 5 % (4) 0 95 % (76) south region development 15,3 % (153) 5 % (8) 1 % (1) 94 % (144) . - , - . 2. OBOR . 3–5. . 3 ( 1 – 4, ) OBOR ( , ) . . 4 - , «South Region Development» . . 5 , - «India Pakistan US» . . 3. ( 1 – 4 — ) OBOR ( , ) 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 10 20 30 40 50 60 70 80 90 - 1 - 2 - 3 - 4 . . , . . , . . 62 . 4. , «South Region Development» . 5. , «India Pakistan US» OBOR Nord Stream, GMO . - , Nord Stream, 1000 , ( 02.11.2018 18.08.2018) - , : merkel putin meeting ( ); gas transit ukraine ( - ); european security energy market ( - 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 2 4 6 8 10 12 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 0 2 4 6 8 10 12 14 16 18 20 ISSN 1560-9189 , , 2018, . 20, 4 63 ), poland united states ( Nord Stream). - , : ; - ; . , , . - . 1. Schouten K., Frasincar F. Survey on aspect-level sentiment analysis. IEEE Transactions on Knowledge and Data Engineering. 2016. Issue 28(3). P. 813–830. 2. Medhat W., Hassan A., Korashy H. Sentiment analysis algorithms and applications: A survey // Ain Shams Engineering Journal. 2014. Issue 5(4). . 1093–1113. 3. Jiang K., Anderton B., Ronald, P., Barnett G. Semantic Network Analysis Reveals Opposing Online Representations of the Search Term «GMO». Global Challenges. 2018. Issue 2(1). . 1700082. DOI: https://doi.org/10.1002/gch2.201700082. 4. . ., . . - . . 2016. . 19(4). C. 71–83. 5. Sudhahar S., Veltri G., Cristianini N. Automated analysis of the US presidential elections using Big Data and network analysis. Big Data & Society. 2015. Issue 2(1). P. 21–49. 6. . ., . ., . . - . - « »: . : , 2018. . 6. 7. Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. The use of horizontal visibility graphs to identify the words that define the informational structure of a text. 12th Mexican International Confer- ence on Artificial Intelligence (MICAI), 2013. P. 209–215. DOI: 10.1109/MICAI.2013.33 8. . . . . - « ». : , 2014. . 7–9. 9. Harenberg S., Bello G., Gjeltema L., Ranshous S., Harlalka J., Seay R., Samatova N. Commu- nity detection in large-scale networks: a survey and empirical evaluation. Wiley Interdisciplinary Re- views: Computational Statistics, 2014. Issue 6(6). . 426–439. 10. Blondel V.D., Guillaume J.L., Lambiotte R., Lefebvre E. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment. 2008. Issue 10. . P10008 11. Newman M.E. Finding community structure in networks using the eigenvectors of matrices. Physical review E. 2006. Iss. 74(3). . 036104. 12. Lande D.V. Identification of information tonality based on Bayesian approach and neural net- works. E-preprint arXiv: 0806.2738 (2008). 14.12.2018 https://doi.org/10.1002/gch2.201700082.