Метод редукции мажоритарного класса в несбалансированных выборках

dc.contributor.authorКаврин, Д.А.
dc.contributor.authorСубботин, С.А.
dc.date.accessioned2020-05-07T18:31:39Z
dc.date.available2020-05-07T18:31:39Z
dc.date.issued2018
dc.description.abstractРассмотрены проблемы формирования обучающих выборок для построения диагностических и распознающих моделей по прецедентам в условиях несбалансированности классов. Предложен метод автоматизации формирования обучающих выборок из исходных несбалансированных выборок большого размера. Метод позволяет значительно сократить размер исходной выборки с сохранением важных топологических свойств путем редукции мажоритарного класса и восстановить количественный баланс классов. Разработано программное обеспечение, реализующее предложенный метод, которое было использовано при проведении вычислительных экспериментов на синтетических и реальных данных. Проведенные эксперименты подтвердили работоспособность и эффективность предложенного метода и реализующего его программного обеспечения.uk_UA
dc.description.abstractРозглянуто проблему формування навчальних вибірок для побудови діагностичних і розпізнавальних моделей за прецедентами в умовах незбалансованості класів. Запропоновано метод автоматизації формування навчальних вибірок з вихідних незбалансованих вибірок великого розміру. Метод дозволяє значно скоротити розмір вихідної вибірки зі збереженням важливих топологічних властивостей шляхом редукції мажоритарного класу та відновити кількісний баланс класів. Розроблено програмне забезпечення, що реалізує запропонований метод, яке було використано при виконанні обчислювальних експериментів на синтетичних і реальних даних. Проведені експерименти підтвердили працездатність та ефективність запропонованого методу та програмного забезпечення, що його реалізує.uk_UA
dc.description.abstractThe problem of the sample selection from the imbalanced large-sized datasets has been addressed for constructing of the diagnostic and pattern recognition models. The goal of the work is the creation of the sampling’s automatization method from the imbalanced large-sized dataset, based on the principles of undersampling. The method of automatization of sample selection from the original imbalanced large-sized dataset has been proposed. he software implementing proposed method has been developed and used in the computational experiments on synthetic and real imbalanced datasets. The conducted experiments confirmed the efficiency and working capacity of the proposed method and its implemented software.uk_UA
dc.identifier.citationМетод редукции мажоритарного класса в несбалансированных выборках / Д.А. Каврин, С.А. Субботин // Реєстрація, зберігання і обробка даних. — 2018. — Т. 20, № 1. — С. 51–59. — Бібліогр.: 14 назв. — рос.uk_UA
dc.identifier.issn1560-9189
dc.identifier.otherDOI: https://doi.org/10.35681/1560-9189.2018.20.1.142902
dc.identifier.udc004.93
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/168688
dc.language.isoruuk_UA
dc.publisherІнститут проблем реєстрації інформації НАН Україниuk_UA
dc.relation.ispartofРеєстрація, зберігання і обробка даних
dc.statuspublished earlieruk_UA
dc.subjectТехнічні засоби отримання і обробки данихuk_UA
dc.titleМетод редукции мажоритарного класса в несбалансированных выборкахuk_UA
dc.title.alternativeМетод редукції мажоритарного класу в незбалансованих вибіркаuk_UA
dc.title.alternativeThe majority classes’ reducing method of imbalanced datasetsuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
05-Kavrin.pdf
Розмір:
525.7 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: