Метод построения и использования семантических моделей для мониторинга общественного мнения
Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информац...
Gespeichert in:
Datum: | 2018 |
---|---|
Hauptverfasser: | , , |
Format: | Artikel |
Sprache: | Russian |
Veröffentlicht: |
Інститут проблем реєстрації інформації НАН України
2018
|
Schriftenreihe: | Реєстрація, зберігання і обробка даних |
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/169072 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraineid |
irk-123456789-169072 |
---|---|
record_format |
dspace |
spelling |
irk-123456789-1690722020-06-04T01:26:32Z Метод построения и использования семантических моделей для мониторинга общественного мнения Додонов, А.Г. Ландэ, Д.В. Березин, Б.А. Інформаційно-аналітичні системи обробки даних Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информации, содержащейся в текстах из сети Интернет. Предложена процедура мониторинга общественного мнения, которая включает три этапа: построение и кластеризацию; отбор документов и определение тональности тематик; визуализацию результатов. Показано построение семантических моделей, применение методов кластерного анализа для определения актуальных тематик, оценивание доли и тональности отдельных подтем в составе общего тематического потока информации. Полученные результаты подтверждают возможность использования предложенного метода мониторинга общественного мнения в различных предметных областях. Запропоновано метод побудови та використання семантичних моделей (СМ) з метою безперервного в часі моніторингу громадської думки (МГД). Під семантичною моделлю в рамках даної роботи розуміється модель предметної області, що має вигляд орієнтованого графа, вершини якого відповідають концептам предметної області, а дуги задають відносини між ними. Семантичні моделі дозволяють використовувати при моніторингу громадської думки результати лінгвостатистичного аналізу текстів (Text Mining), застосування методів екстрагування інформації (Information Extraction), що містяться в текстах з мережі Інтернет. У той час, як існуючі проекти аналізу громадської думки більше орієнтовані на разові (статичні) дослідження громадської думки щодо об’єктів і явищ, запропоновано метод автоматизованої побудови та використання СМ на основі безперервного в часі моніторингу громадської думки в мережі Інтернет. Процедура МГД включає три етапи: побудову та кластеризацію СМ; відбір документів і визначення тональності тематик; візуалізацію результатів. Показано побудову СМ за допомогою алгоритму компактифікованого графа горизонтальній видимості, застосування методів кластерного аналізу для визначення актуальних тематик, оцінювання частки та тональності окремих підтем у складі загального тематичного потоку інформації. Як приклади розглянуто моделі предметних областей, що відповідають темам: «One Belt, One Road», «Nord Stream», «Генетично модифіковані організми». Отримані результати підтверджують можливість використання запропонованого методу моніторингу громадської думки у різних предметних областях. It is proposed a method for constructing and using semantic models (SM) for the purpose of continuous monitoring of public opinion, opinion mining (OM). Under the semantic model in the framework of this work, it is implied the subject domain model, which has the form of a directed graph, the vertices of which correspond to the concepts of the domain, and the arcs define the relations between them. Semantic models make it possible to use the results of linguistic statistical analysis of texts (Text Mining) and the use of Information Extraction methods contained in texts from the Internet for opinion mining. While the existing public opinion analysis projects are more focused on one-time (static) public opinion research on objects and phenomena, it is proposed a method for automated construction and use of SM based on continuous monitoring of public opinion on the Internet. The OM procedure consists of three steps: the construction and clustering of the SM; selection of documents and the sentiment definition of topics; visualization of results. The SM construction using the compactified horizontal visibility graph algorithm, the use of cluster analysis methods for determining relevant topics, estimating the proportion and tonality of individual sub-themes in the overall thematic information flow is shown. As examples, the models of subject areas corresponding to the topics: «One Belt, One Road», «Nord Stream», «Genetically Modified Organisms» are examined. The obtained results confirm the possibility of using the proposed method of opinion monitoring in various subject areas. 2018 Article Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос. DOI: https://doi.org/10.35681/1560-9189.2018.20.4.178928 1560-9189 http://dspace.nbuv.gov.ua/handle/123456789/169072 004.421 ru Реєстрація, зберігання і обробка даних Інститут проблем реєстрації інформації НАН України |
institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
collection |
DSpace DC |
language |
Russian |
topic |
Інформаційно-аналітичні системи обробки даних Інформаційно-аналітичні системи обробки даних |
spellingShingle |
Інформаційно-аналітичні системи обробки даних Інформаційно-аналітичні системи обробки даних Додонов, А.Г. Ландэ, Д.В. Березин, Б.А. Метод построения и использования семантических моделей для мониторинга общественного мнения Реєстрація, зберігання і обробка даних |
description |
Предложен метод построения и использования семантических моделей с целью непрерывного во времени мониторинга общественного мнения. Семантические модели позволяют использовать при мониторинге общественного мнения результаты лингвостатистического анализа текстов, применения методов извлечения информации, содержащейся в текстах из сети Интернет. Предложена процедура мониторинга общественного мнения, которая включает три этапа: построение и кластеризацию; отбор документов и определение тональности тематик; визуализацию результатов. Показано построение семантических моделей, применение методов кластерного анализа для определения актуальных тематик, оценивание доли и тональности отдельных подтем в составе общего тематического потока информации. Полученные результаты подтверждают возможность использования предложенного метода мониторинга общественного мнения в различных предметных областях. |
format |
Article |
author |
Додонов, А.Г. Ландэ, Д.В. Березин, Б.А. |
author_facet |
Додонов, А.Г. Ландэ, Д.В. Березин, Б.А. |
author_sort |
Додонов, А.Г. |
title |
Метод построения и использования семантических моделей для мониторинга общественного мнения |
title_short |
Метод построения и использования семантических моделей для мониторинга общественного мнения |
title_full |
Метод построения и использования семантических моделей для мониторинга общественного мнения |
title_fullStr |
Метод построения и использования семантических моделей для мониторинга общественного мнения |
title_full_unstemmed |
Метод построения и использования семантических моделей для мониторинга общественного мнения |
title_sort |
метод построения и использования семантических моделей для мониторинга общественного мнения |
publisher |
Інститут проблем реєстрації інформації НАН України |
publishDate |
2018 |
topic_facet |
Інформаційно-аналітичні системи обробки даних |
url |
http://dspace.nbuv.gov.ua/handle/123456789/169072 |
citation_txt |
Метод построения и использования семантических моделей для мониторинга общественного мнения / А.Г. Додонов, Д.В. Ландэ, Б.А. Березин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 53–63. — Бібліогр.: 12 назв. — рос. |
series |
Реєстрація, зберігання і обробка даних |
work_keys_str_mv |
AT dodonovag metodpostroeniâiispolʹzovaniâsemantičeskihmodelejdlâmonitoringaobŝestvennogomneniâ AT landédv metodpostroeniâiispolʹzovaniâsemantičeskihmodelejdlâmonitoringaobŝestvennogomneniâ AT berezinba metodpostroeniâiispolʹzovaniâsemantičeskihmodelejdlâmonitoringaobŝestvennogomneniâ |
first_indexed |
2025-07-15T03:48:46Z |
last_indexed |
2025-07-15T03:48:46Z |
_version_ |
1837683260164931584 |
fulltext |
-
ISSN 1560-9189 , , 2018, . 20, 4 53
004.421
. . , . . , . .
. . , 2, 03113 ,
-
. -
, , -
.
, :
; -
; . -
,
, -
-
. -
-
.
: , ,
, , - , -
.
( )
, ,
,
. , , , . . -
-
.
, , -
, -
© . . , . . , . .
. . , . . , . .
54
- -
, . . -
-
(Text Mining), (Information Ext-
raction), .
( -
) ,
-
-
.
-
(Natural Lan-
guage Processing).
.
( , ).
, , ,
(Sentiment Analysis — SA, Opinion Mining — OM) , -
, , , -
, [1, 2].
: , ,
. , -
, ,
( , . .) .
,
. -
, ,
.
[3] -
- , ,
.
- Google, Google News, -
, . .
, -
.
,
, .
[4]
Youtube.
-
. Youtube -
. -
. -
. ,
ISSN 1560-9189 , , 2018, . 20, 4 55
.
[5]
2012 . , . -
81 . 400 -
.
« - - » ,
, . . -
-
.
-
( ) , -
[6]:
— ;
— ;
— .
:
— ;
— ; -
[7];
— ;
— , ( -
).
:
— , ( ),
;
— ;
— .
:
— ;
— ( )
.
,
.
.
.
.
. -
, , - , -
. ( -
). ,
, , TFIDF , -
, [8].
. . , . . , . .
56
-
. -
-
( ) [7], .
1. , -
,
( — ).
2. . -
, « », . .
,
.
3. .
, . -
.
,
-
. .
,
, , -2, -
. , 28 -
OBOR , . 1.
. 1. 28 OBOR
. -
,
—
(clastering graph, community detection). [9]
, .
ISSN 1560-9189 , , 2018, . 20, 4 57
- -
-
. [9]
, ( -
). -
. , -
, Louvain, Leading
igenvector, Walktrap.
-
Louvain [10], -
. .
,
. -
, -
, , . -
, -
. : , -
-
. , .
Leading Eigenvector [11] -
.
, , .
, ,
.
.
Walktrap [9],
( ) . -
, , ,
. ,
. ,
.
, , -
(«One Belt, One Road» — OBOR) -
, . 1.
, . -
-
, , . .
. , -
, , .
-
-
, , ,
.
OBOR, , -
,
. 2. , -
. . , . . , . .
58
( ),
, .
.
.
, , -
,
,
.
.
,
- InfoStream (one-road)&(one-belt)&china,
OBOR, . 2.
,
, . 3.
.
— , , -
, ,
. , -
[5]. -
, -
, , -
, , , . . -
: -
, , , ,
( , « -
» ). , -
OBOR, . 3.
. -
. -
. -
, , -
, -
( . 3, . 2). : , -
; ; -
,
. -
-
.
( ) OBOR . 3–5.
, -
Gephi (http://gephi.org),
,
R.
.
http://gephi.org
ISSN 1560-9189 , , 2018, . 20, 4 59
. 2. .
-
-
- :
One Belt, One Road (OBOR) —
« » « -
XXI »;
Nord Stream —
;
GMO — -
. OBOR -
1000 ( 30.11.2018 25.07.2018), -
(one-road)&(one-belt)&china -
InfoStream.
,
, ( ,
TFIDF) ( .
1). , Louvain, Leading
Eigenvector Walktrap , . 1.
. 1 , -
. 1, 2 — -
, ,
, 3–5 — ,
, TFIDF. -
-
, -
. , -
. . , . . , . .
60
-
, , , -
( . 2).
1. ,
OBOR
Louvain Walktrap Louvain
(TFIDF)
Walktrap
(TFIDF)
Leading eigenvector
(TFIDF)
economy military world
countries country state
global war trade projects
economic cooperation
security political
infrastructure investment
development international
support national
india military power
pakistan country us
strategic might russia
american political
iran russian defense
syria turkey
india world relations
war united states russia
japan think iran defense
syria
chinese president people
government market xi
business million debt
including beijing billion
summit leaders
sri chinese president
people government
projects xi debt
trump project
investment cpec
billion port bri
sri chinese president
obor people government
projects xi cooperation
debt project investment
beijing summit port bri
india china south asia
power region pakistan
relations influence us
strategic east europe
russia american trump
japan africa part sea
south region
relations indian
xinjiang economic
cooperation africa
development beijing
summit pacific
taiwan
china's military south
power region state
global strategic might
economic american
security political africa
research uighur pacific
taiwan
prime minister foreign
policy
prime
minister
foreign
prime minister
foreign japanese abe
mahathir malaysia
prime
minister
japanese abe
mahathir
malaysia
prime minister foreign
japanese abe mahathir
russian
china's road belt initiative
project silk
road belt
initiative
silk
china's global obor
market research
2. ,
,
1 xi projects investment ( )
bri
2 india pakistan us , ,
3 south region development
4 japan minister abe
ISSN 1560-9189 , , 2018, . 20, 4 61
, , -
, . 3.
, -
OBOR.
3.
«OBOR»
xi projects investment 10,1 % (101) 2 % (2) 0 98 % (99)
japan minister abe 9,2 % (92) 1 % (1) 0 99 % (91)
india pakistan us 8 % (80) 5 % (4) 0 95 % (76)
south region
development 15,3 % (153) 5 % (8) 1 % (1) 94 % (144)
. -
, -
. 2.
OBOR
. 3–5. . 3
( 1 – 4, )
OBOR ( , ) . . 4 -
,
«South Region Development» .
. 5 , -
«India Pakistan US» .
. 3. ( 1 – 4 —
) OBOR ( , )
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0
10
20
30
40
50
60
70
80
90
- 1
- 2
- 3
- 4
. . , . . , . .
62
. 4. ,
«South Region Development»
. 5. ,
«India Pakistan US»
OBOR
Nord Stream, GMO . -
, Nord Stream, 1000 ,
( 02.11.2018 18.08.2018) -
, : merkel putin meeting (
); gas transit ukraine ( -
); european security energy market ( -
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0
2
4
6
8
10
12
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18
0
2
4
6
8
10
12
14
16
18
20
ISSN 1560-9189 , , 2018, . 20, 4 63
), poland united states ( Nord
Stream).
-
, : ; -
; .
,
,
.
-
.
1. Schouten K., Frasincar F. Survey on aspect-level sentiment analysis. IEEE Transactions on
Knowledge and Data Engineering. 2016. Issue 28(3). P. 813–830.
2. Medhat W., Hassan A., Korashy H. Sentiment analysis algorithms and applications: A survey //
Ain Shams Engineering Journal. 2014. Issue 5(4). . 1093–1113.
3. Jiang K., Anderton B., Ronald, P., Barnett G. Semantic Network Analysis Reveals Opposing
Online Representations of the Search Term «GMO». Global Challenges. 2018. Issue 2(1). . 1700082.
DOI: https://doi.org/10.1002/gch2.201700082.
4. . ., . . -
.
. 2016. . 19(4). C. 71–83.
5. Sudhahar S., Veltri G., Cristianini N. Automated analysis of the US presidential elections using
Big Data and network analysis. Big Data & Society. 2015. Issue 2(1). P. 21–49.
6. . ., . ., . . -
. -
« »: . : , 2018. . 6.
7. Lande D.V., Snarskii A.A., Yagunova E.V., Pronoza E.V. The use of horizontal visibility graphs
to identify the words that define the informational structure of a text. 12th Mexican International Confer-
ence on Artificial Intelligence (MICAI), 2013. P. 209–215. DOI: 10.1109/MICAI.2013.33
8. . . .
. - «
». : , 2014. . 7–9.
9. Harenberg S., Bello G., Gjeltema L., Ranshous S., Harlalka J., Seay R., Samatova N. Commu-
nity detection in large-scale networks: a survey and empirical evaluation. Wiley Interdisciplinary Re-
views: Computational Statistics, 2014. Issue 6(6). . 426–439.
10. Blondel V.D., Guillaume J.L., Lambiotte R., Lefebvre E. Fast unfolding of communities in
large networks. Journal of Statistical Mechanics: Theory and Experiment. 2008. Issue 10. . P10008
11. Newman M.E. Finding community structure in networks using the eigenvectors of matrices.
Physical review E. 2006. Iss. 74(3). . 036104.
12. Lande D.V. Identification of information tonality based on Bayesian approach and neural net-
works. E-preprint arXiv: 0806.2738 (2008).
14.12.2018
https://doi.org/10.1002/gch2.201700082.
|