Модель вторинних некорельованих семантичних полів для анализу текстових даних
Розглянуто модель некорельованих вторинних семантичних полів утворених на основі методу головних компонент та сингулярного розкладу матриці частот семантичних полів. Ця модель характеризує новий семантичний простір відображення текстових документів із ортонормованим базисом. Розмірність простору вто...
Gespeichert in:
Datum: | 2014 |
---|---|
1. Verfasser: | |
Format: | Artikel |
Sprache: | Ukrainian |
Veröffentlicht: |
Навчально-науковий комплекс "Інститут прикладного системного аналізу" НТУУ "КПІ" МОН та НАН України
2014
|
Schriftenreihe: | Системні дослідження та інформаційні технології |
Schlagworte: | |
Online Zugang: | http://dspace.nbuv.gov.ua/handle/123456789/85560 |
Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
Zitieren: | Модель вторинних некорельованих семантичних полів для анализу текстових даних / Б.М. Павлишенко // Системні дослідження та інформаційні технології. — 2014. — № 3. — С. 130-138. — Бібліогр.: 11 назв. — укр. |
Institution
Digital Library of Periodicals of National Academy of Sciences of UkraineZusammenfassung: | Розглянуто модель некорельованих вторинних семантичних полів утворених на основі методу головних компонент та сингулярного розкладу матриці частот семантичних полів. Ця модель характеризує новий семантичний простір відображення текстових документів із ортонормованим базисом. Розмірність простору вторинних семантичних полів є суттєво меншою за розмірність простору первинних семантичних полів внаслідок заміни взаємопов’язаних складових некорельованими семантичними характеристиками. Аналіз тестової вибірки текстових документів показав можливість брати до розгляду лише ті складові вторинних семантичних полів, які описуються першими сингулярними числами. Використання низькорозмірного ортонормованого базису вторинних семантичних полів може бути ефективним в задачах класифікації та кластеризації текстових даних. |
---|