Метод розрахунку когерентності українського тексту

dc.contributor.authorПогорілий, С.Д.
dc.contributor.authorКрамов, А.А.
dc.date.accessioned2020-06-03T18:05:38Z
dc.date.available2020-06-03T18:05:38Z
dc.date.issued2018
dc.description.abstractПроаналізовано основні методи автоматизованої оцінки когерентності тексту, який написано природною мовою. Запропоновано вдосконалення методу графа семантичної схожості за допомогою попередньої підготовки моделі, а саме здійснення навчання нейронної мережі векторного представлення речень. Проведено експериментальну перевірку роботи методу графа семантичної схожості та його модифікованих версій на множині україномовних статей наукових журналів різної тематики. Ефективність роботи методу та його модифікацій розраховано за допомогою вирішення типових задач оцінки когерентності тексту: задач розрізнення документів і вставки. На основі отриманих результатів визначено найбільш ефективні модифікацію та параметри методу графа семантичної схожості для оцінки когерентності україномовних текстів.uk_UA
dc.description.abstractПроанализированы основные методы автоматизированной оценки когерентности текста, написанного на естественном языке, с помощью подходов, основанных на машинном обучении. Предложено усовершенствование метода графа семантического сходства с помощью предварительной подготовки модели, а именно осуществления обучения нейронной сети векторного представления предложений. Проведена экспериментальная проверка работы метода графа семантического сходства и его модифицированных версий на множестве статей, написанных на украинском языке, научных журналов различной тематики. Эффективность работы метода и его модификаций рассчитана с помощью решения типичных задач оценки когерентности текста: задач различения документов и вставки. На основе полученных результатов определены наиболее эффективные модификации и параметры метода графа семантического сходства для оценки когерентности текстов, написанных на украинском языке.uk_UA
dc.description.abstractDue to the growing role of the SEO technologies, it is necessary to perform an automated analysis of the article’s quality. Such an approach helps both to return the most intelligible pages for the user’s query and to raise the web-sites positions to the top of query results. An automated assessment of a coherence is a part of the complex analysis of the text. In this article, main methods for text coherence measurements for Ukrainian languageare analyzed. Expediency of using the semantic similarity graph method in comparison with other methods is explained. It is suggested the improvement of that method by the pretraining of the neural network for vector representations of sentences. Experimental examination of the original method and its modifications is made. Training and examination procedures are made on the corpus of Ukrainian texts, which were previously retrieved from abstracts and full texts of Ukrainian scientific articles. The testing procedure is implemented by performing of two typical tasks for the text coherence assessment: document discrimination task and insertion task. Accordingly to the analysis it is defined the most effective combination of method’s modification and its parameter for the measurement of the text coherence.uk_UA
dc.identifier.citationМетод розрахунку когерентності українського тексту / С.Д. Погорілий, А.А. Крамов // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 4. — С. 64–75. — Бібліогр.: 15 назв. — укр.uk_UA
dc.identifier.issn1560-9189
dc.identifier.otherDOI: https://doi.org/10.35681/1560-9189.2018.20.4.178945
dc.identifier.udc004.83
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/169073
dc.language.isoukuk_UA
dc.publisherІнститут проблем реєстрації інформації НАН Україниuk_UA
dc.relation.ispartofРеєстрація, зберігання і обробка даних
dc.statuspublished earlieruk_UA
dc.subjectІнформаційно-аналітичні системи обробки данихuk_UA
dc.titleМетод розрахунку когерентності українського текстуuk_UA
dc.title.alternativeМетод расчета когерентности украинского текстаuk_UA
dc.title.alternativeMethod of the coherence evaluation of Ukrainian textuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
06-Pogorilyy.pdf
Розмір:
312.93 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: