Автоматическое реферирование китайской правовой информации

dc.contributor.authorЛандэ, Д.
dc.contributor.authorЦзыцзян Ян
dc.contributor.authorШивэй Чжу
dc.contributor.authorЦзяньпин Го
dc.contributor.authorМоцзи Вэй
dc.date.accessioned2020-05-08T19:14:32Z
dc.date.available2020-05-08T19:14:32Z
dc.date.issued2018
dc.description.abstractРабота посвящена методу автоматического реферирования правовой информации, представленной на китайском языке. Рассмотрена модель реферата и процедура его формирования. Предложено два подхода, а именно: для определения уровня важности предложений - перейти к определению весовых значений отдельных иероглифов, а не слов в тексте документов и рефератов. Также предложено рассмотрение модели документов как сети предложений для выявления наиболее важных предложений по параметрам этой сети. Реализованы и испытаны различные методы автоматического реферирования. Показано применение двух оценок качества реферата без участия экспертов - косинусной меры и дивергениции Дженсена-Шеннона (Jensen-Shannon). Реферирование на основе предложенной сетевой модели документа оказалось лучшим по критериям косинусной меры и расстояния Дженсена-Шеннона для рефератов, объем которых превышает 2 предложения. Предложенный подход с учетом небольших изменений может использоваться для текстов произвольной тематики, в частности, научно-технической и новостной информации.uk_UA
dc.description.abstractРоботу присвячено методу автоматичного реферування правової інформації, що представ-лено китайською мовою. Розглянуто модель реферату та процедуру його формування. Запропоно-вано два підходи, а саме, для визначення рівня важливості речень — перейти до визначення ваго-вих значень окремих ієрогліфів, а не слів у тексті документів і рефератів. Також запропоновано розгляд моделі документів як мережі із речень для виявлення найбільш важливих речень за пара-метрами цієї мережі. Реалізовано та випробувано різні методи автоматичного реферування. Пока-зано застосування двох оцінок якості реферату без участі експертів — косинусної міри і відстані Дженсена-Шеннона (Jensen-Shannon). Реферування на основі запропонованої мережевої моделі документа виявилося кращим за критеріями косинусної міри та відстані Дженсена-Шеннона для рефератів, обсяг яких перевищує 2 речення. Запропонований підхід з урахуванням невеликих змін може використовуватися для текстів довільної тематики, зокрема, науково-технічної та новинної інформації.uk_UA
dc.description.abstractA method of automatic text summarization of the legal information provided in Chinese has been developed. The model of the abstract and the procedure of his formation are considered. Two ap-proaches are proposed, namely, to determine the level of importance of sentences, it was suggested to proceed to determine the weight values of separate hieroglyphs, rather than words in the text of documents and abstracts. Also consideration of model of documents as networks of sentences for detection of the most important sentences on parameters of this network has been offered. A new hybrid method of automatic text summarization, covering statistical and marker methods, as well as taking into account the location of sentences in the text of the document is introduced.uk_UA
dc.identifier.citationАвтоматическое реферирование китайской правовой информации / Д. Ландэ, Цзыцзян Ян, Шивэй Чжу, Цзяньпин Го, Моцзи Вэй // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 3. — С. 67–82. — Бібліогр.: 20 назв. — рос.uk_UA
dc.identifier.issn1560-9189
dc.identifier.otherDOI: https://doi.org/10.35681/1560-9189.2018.20.3.158214
dc.identifier.udc004.44:002.513.5
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/168766
dc.language.isoruuk_UA
dc.publisherІнститут проблем реєстрації інформації НАН Україниuk_UA
dc.relation.ispartofРеєстрація, зберігання і обробка даних
dc.relation.ispartofРеєстрація, зберігання і обробка даних
dc.statuspublished earlieruk_UA
dc.subjectІнформаційно-аналітичні системи обробки данихuk_UA
dc.titleАвтоматическое реферирование китайской правовой информацииuk_UA
dc.title.alternativeАвтоматичне реферування китайської правової інформаціїuk_UA
dc.title.alternativeA method for public opinion-based formal description of weakly structured subject domainsuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
07-Lande.pdf
Розмір:
1.11 MB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: