Покращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій

dc.contributor.authorЛітвинчук, А.М.
dc.contributor.authorБарановська, Л.В.
dc.date.accessioned2025-11-12T12:49:44Z
dc.date.issued2021
dc.description.abstractРозпізнавання облич — одна з основних задач комп’ютерного зору, актуальна в силу її практичної значущості та викликає велику зацікавленість широкого кола науковців. І хоча дослідження у сфері відбувались з початку розвитку комп’ютерного зору, адекватних результатів змогли досягнути лише за допомогою згорткових нейронних мереж. У даній роботі проведено порівняльний аналіз методів розпізнавання обличчя до згорткових нейронних мереж. Розглянуто метод навчання подібності, аугментації та розклади зміни темпу навчання. Проведено ряд експериментів, виконано порівняльний аналіз розглянутих методів покращення згорткових нейронних мереж, у результаті отримано універсальний алгоритм для навчання моделі розпізнавання облич. У роботі використано SE-ResNet50 як єдину мережу для експериментів. Навчання подібності — це метод, за допомогою якого можливо досягнути достатньої точності. Перенавчання є серйозною проблемою для нейронних мереж, зокрема тому, що мають дуже багато параметрів, а даних зазвичай не настільки багато, щоб гарантувати узагальнюючу можливість моделі. Додаткова розмітка даних може займати багато часу і бути доволі дорогою, тому виник такий підхід, як аугментації. Аугментації штучно збільшують тренувальний набір даних, тому цілком природньо, що метод аугментації у всіх експериментах покращив результати відносно початкового експерименту. Різні степені та більш агресивні форми аугментації у задачі розпізнавання облич у даній роботі приводив до кращих результатів. Як і очікувалось, найкращим розкладом зміни темпу навчання виявився косинусний з розігрівом та оновленнями. Цей розклад має мало параметрів, до того ж зручний у використанні. Загалом, використовуючи різні підходи, отримали точність 93,5 % на досить складному наборі даних, що на 22 % краще за базовий експеримент. У наступних дослідженнях планується розглянути покращення не лише моделі розпізнавання облич, а й детекції. Від якості детекції обличчя безпосередньо залежить точність розпізнавання.
dc.description.abstractFace recognition is one of the main tasks of computer vision, which is relevant due to its practical significance and great interest of wide range of scientists. It has many applications, which has led to a huge amount of research in this area. And although research in the field has been going on since the beginning of the computer vision, good results could be achieved only with the help of convolutional neural networks. In this work, a comparative analysis of facial recognition methods before convolutional neural networks was performed. A metric learning approach, augmentations and learning rate schedulers are considered. There were performed bunch of experiments and comparative analysis of the considered methods of improvement of convolutional neural networks. As a result a universal algorithm for training the face recognition model was obtained. In this work, we used SE-ResNet50 as the only neural network for experiments. Metric learning is a method by which it is possible to achieve good accuracy in face recognition. Overfitting is a big problem of neural networks, in particular because they have too many parameters and usually not enough data to guarantee the generalization of the model. Additional data labeling can be time-consuming and expensive, so there is such an approach as augmentation. Augmentations artificially increase the training dataset, so as expected, this method improved the results relative to the original experiment in all experiments. Different degrees and more aggressive forms of augmentation in this work led to better results. As expected, the best learning rate scheduler was cosine scheduler with warm-ups and restarts. This schedule has few parameters, so it is also easy to use. In general, using different approaches, we were able to obtain an accuracy of 93,5 %, which is 22 % better than the baseline experiment. In the following studies, it is planned to consider improving not only the model of facial recognition, but also detection. The accuracy of face detection directly depends on the quality of face recognition.
dc.identifier.citationПокращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу нав-чання та аугментацій / А.М. Літвінчук, Л.В. Барановська // Проблемы управления и информатики. — 2021. — № 6. — С. 93-101. — Бібліогр.: 7 назв. — укр.
dc.identifier.doi10.34229/1028-0979-2021-6-9
dc.identifier.issn0572-2691
dc.identifier.udc004.93
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/209049
dc.language.isouk
dc.publisherІнститут кібернетики ім. В.М. Глушкова НАН України
dc.relation.ispartofПроблемы управления и информатики
dc.statuspublished earlier
dc.subjectРоботы и системы искусственного интеллекта
dc.titleПокращення моделей розпізнавання облич за допомогою навчання подібності, розкладу зміни темпу навчання та аугментацій
dc.title.alternativeУлучшение моделей распознавания лиц с использованием обучения подобия, графика изменения темпа обучения и аугментаций
dc.title.alternativeImprovement of face recognition models using similarity learning, learning rate schedule, and augmentations
dc.typeArticle

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
09-Litvynchuk.pdf
Розмір:
650.31 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: