Метод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні

dc.contributor.authorОхріменко, А.О.
dc.contributor.authorКуссуль, Н.М.
dc.date.accessioned2025-12-23T03:36:25Z
dc.date.issued2023
dc.description.abstractРозглядається проблема неоднозначності в задачах класифікації в області машинного навчання. Задача класифікації полягає у навчанні моделі відрізняти екземпляри даних, що належать різним класам. Однак можливі ситуації, коли правильна класифікація певної множини екземплярів даних складна або навіть неможлива, незалежно від складності моделі машинного навчання. Запропоновано метод та алгоритм виявлення таких неоднозначних екземплярів даних, що базуються на використанні методу найближчого сусіда та аналізу класів екземплярів даних, розташованих поряд у просторі ознак, та дозволяють виділити підмножину неоднозначних екземплярів даних, що можуть негативно впливати на процес навчання моделі класифікації. З метою демонстрації практичного застосування алгоритму проведено експеримент на чотириканальному супутниковому композиті, що використовується для попіксельної класифікації сільськогосподарських культур.
dc.description.abstractThe problem of ambiguity in classification tasks in the field of machine learning is considered. The classification task involves training a model to distinguish instances of data belonging to different classes. However, situations may arise where the correct classification of a certain set of data instances is difficult or even impossible, regardless of the complexity of the machine learning model. A method and algorithm for detecting such ambiguous data instances are proposed, based on the use of the nearest neighbor method and analysis of the classes of data instances located close to each other in the feature space. These methods allow for identifying a subset of ambiguous data instances that may negatively affect the training process of the classification model. To demonstrate the practical application of the algorithm, an experiment was conducted on a four-channel satellite composite used for pixel-wise classification of agricultural crops.
dc.description.sponsorshipРобота виконана в межах проєкту Національного фонду досліджень України 2020.02/0292 «Методи і моделі глибинного навчання для прикладних задач супутникового моніторингу» (конкурс «Підтримка досліджень провідних та молодих учених»).
dc.identifier.citationМетод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні / А.О. Охріменко, Н.М. Куссуль // Проблеми керування та інформатики. — 2023. — № 4. — С. 84-95. — Бібліогр.: 23 назв. — укр.
dc.identifier.doi10.34229/1028-0979-2023-4-7
dc.identifier.issn0572-2691
dc.identifier.udc004.8, 004.93
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/211050
dc.language.isouk
dc.publisherІнститут кібернетики ім. В.М. Глушкова НАН України
dc.relation.ispartofПроблеми керування та інформатики
dc.statuspublished earlier
dc.subjectКосмічні інформаційні технології та системи
dc.titleМетод виявлення складних для розпізнавання зразків у наборах даних для задач класифікації у машинному навчанні
dc.title.alternativeData mining of machine learning datasets for hard case identification
dc.typeArticle

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
07-Okhrimenko.pdf
Розмір:
548.14 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: