Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних
dc.contributor.author | Шаховська, Н.Б | |
dc.contributor.author | Швороб, І.Б. | |
dc.date.accessioned | 2018-06-04T19:11:08Z | |
dc.date.available | 2018-06-04T19:11:08Z | |
dc.date.issued | 2017 | |
dc.description.abstract | 80% світових даних є неструктурованими або слабоструктурованими. У зв’язку з цим, актуальною є проблема екстракції інформації та її подальше збереження у зручній для опрацювання формі. Для зручності екстракції даних у роботі запропоновано використання текстових шаблонів на основі словника ключових слів. Основною метою є розроблення методу виділення складових елементів для побудови текстового шаблону, а також розроблення методу кластеризації текстового шаблону. Проведено аналіз розроблених методів на прикладі роботи бібліотечної системи. | uk_UA |
dc.description.abstract | 80% of world data is unstructured or semistructured. In this regard, the main task is the problem of extraction of information and its further preservation in a form suitable for processing. For the convenience of data extraction, we suggest using text templates based on the dictionary of keywords. The main goal is to develop a method for selecting component elements for constructing a text template, as well as developing a method for clustering a text template. The analysis of the developed methods on the example of work of the library system is carried out. | uk_UA |
dc.identifier.citation | Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних / Н.Б. Шаховська, І.Б. Швороб // Штучний інтелект. — 2017. — № 2. — С. 60-69. — Бібліогр.: 6 назв. — укр. | uk_UA |
dc.identifier.issn | 1561-5359 | |
dc.identifier.udc | 004.9:371.261 | |
dc.identifier.uri | https://nasplib.isofts.kiev.ua/handle/123456789/133664 | |
dc.language.iso | uk | uk_UA |
dc.publisher | Інститут проблем штучного інтелекту МОН України та НАН України | uk_UA |
dc.relation.ispartof | Штучний інтелект | |
dc.status | published earlier | uk_UA |
dc.subject | Системи розпізнавання і сприйняття образів | uk_UA |
dc.title | Метод побудови текстового шаблону для екстракції інформації зі слабоструктурованих даних | uk_UA |
dc.title.alternative | Method of constructing a text template for extracting information from semistructured data | uk_UA |
dc.type | Article | uk_UA |
Файли
Оригінальний контейнер
1 - 1 з 1
Завантаження...
- Назва:
- 07-Shakhovska.pdf
- Розмір:
- 1.01 MB
- Формат:
- Adobe Portable Document Format
Контейнер ліцензії
1 - 1 з 1
Завантаження...
- Назва:
- license.txt
- Розмір:
- 817 B
- Формат:
- Item-specific license agreed upon to submission
- Опис: