A method for extracting data from semis-tructured documents
Linguistic method to solve the problem of data extraction from weakly structured documents is developed, approved, and described in detail in the paper. Sample data were taken from thesis catalogue of Vernadsky National Library of Ukraine. The sequence of all stages is described: document collection...
Збережено в:
Дата: | 2020 |
---|---|
Автори: | Kudim, K.A., Proskudina, G.Yu. |
Формат: | Стаття |
Мова: | rus |
Опубліковано: |
Інститут програмних систем НАН України
2020
|
Теми: | |
Онлайн доступ: | https://pp.isofts.kiev.ua/index.php/ojs1/article/view/388 |
Теги: |
Додати тег
Немає тегів, Будьте першим, хто поставить тег для цього запису!
|
Назва журналу: | Problems in programming |
Репозитарії
Problems in programmingСхожі ресурси
-
Methods and tools for extracting personal data from theses abstracts
за авторством: Kudim, K.A., та інші
Опубліковано: (2019) -
Extracting structure from text documents based on machine learning
за авторством: Kudim, K.A., та інші
Опубліковано: (2023) -
About technologies of use of external data on creating and editing of encyclopedic texts
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2018) -
Mixed topic-entity ontology for enhanced topic vector-spaced model
за авторством: Shabinskiy, A.S.
Опубліковано: (2025) -
Overview of global open access resource aggregation services and their requirements for data providers
за авторством: Proskudina, G.Yu., та інші
Опубліковано: (2025)