Використання лексемних полів у інтелектуальному аналізі текстових масивів
Завантаження...
Дата
Автори
Назва журналу
Номер ISSN
Назва тому
Видавець
Інститут проблем штучного інтелекту МОН України та НАН України
Анотація
У роботі запропонована модель семантичних та тематичних лексемних полів для інтелектуального аналізу
текстових документів. Розглянуто векторну модель текстових документів у семантичному просторі, базис
якого утворено частотно-дистрибутивними характеристиками семантичних та тематичних полів.
Експериментальний аналіз тестової вибірки показав високу ефективність використання лексемних полів у
класифікаційному аналізі авторства текстів.
В работе предложена модель семантических и тематических лексемных полей для интеллектуального анализа текстовых документов. Рассмотрена векторная модель текстовых документов в семантическом пространстве, базис которого образован частотно-дистрибутивными характеристиками семантических и тематических полей. Экспериментальный анализ тестовой выборки показал высокую эффективность использования лексемных полей в классификационном анализе авторства текстов.
The model of semantic and thematic lexemes fields for data mining of text documents has been proposed. The vector model of text documents in the semantic space was considered. The basis of this space is formed by frequency-distributional characteristics of semantic and thematic fields. The experimental analysis of texts samples showed high efficiency of lexemes fields usage in the classification analysis of texts authorship.
В работе предложена модель семантических и тематических лексемных полей для интеллектуального анализа текстовых документов. Рассмотрена векторная модель текстовых документов в семантическом пространстве, базис которого образован частотно-дистрибутивными характеристиками семантических и тематических полей. Экспериментальный анализ тестовой выборки показал высокую эффективность использования лексемных полей в классификационном анализе авторства текстов.
The model of semantic and thematic lexemes fields for data mining of text documents has been proposed. The vector model of text documents in the semantic space was considered. The basis of this space is formed by frequency-distributional characteristics of semantic and thematic fields. The experimental analysis of texts samples showed high efficiency of lexemes fields usage in the classification analysis of texts authorship.
Опис
Теми
Анализ и синтез коммуникационной информации
Цитування
Використання лексемних полів у інтелектуальному аналізі текстових масивів / Б.М. Павлишенко // Искусственный интеллект. — 2013. — № 1. — С. 98–109. — Бібліогр.: 19 назв. — укр.