Некоторые способы моделирования входных данных для поиска информации в библиотеке эталонов при решении задач семантики
Завантаження...
Дата
Автори
Назва журналу
Номер ISSN
Назва тому
Видавець
Інститут кібернетики ім. В.М. Глушкова НАН України
Анотація
Для встановлення суті предмета використовують еталонну інформацію, що міститься в базах даних та є структурованою сукупністю взаємопов’язаних даних певної предметної області. Для швидкого знаходження в ній необхідної інформації ця база має бути структурована, а також відповідно змодельовані і вхідні дані. Нині існують різні моделі даних зі своїми перевагами та недоліками, і кожна з них має свою область застосування. Наведено приклади задач семантики, що відносяться до задач розпізнавання і для встановлення суті певного об’єкта потребують знаходження його еталона в базі даних. Це — розпізнавання мовлення, розпізнавання дитячого, жіночого, чоловічого голосів, задача клінічної діагностики, порівняння текстів на плагіат, автоматичний переклад текстів з однієї мови на іншу тощо. Порівняння вхідної інформації та еталона проводиться двома способами: за первинними ознаками, які описують шуканий об’єкт, і за заданим об’єктом. При другому способі попереднє покриття певними ознаками еталона і об’єкта не проводиться. При моделюванні вхідних даних для пошуку інформації за першим способом має місце покриття певними ознаками заданих об’єктів. Ознаки розділяються на такі, які характеризують лише заданий об’єкт, за якими досить просто його визначити в базі даних. В цьому разі задача є розв’язною. Якщо однакові ознаки описують різні об’єкти, але за допомогою диференціального аналізу можна знайти потрібний об’єкт, то така задача є частково розв’язною. Якщо одні і ті ж ознаки характеризують різні об’єкти і за ними не можна ідентифікувати шуканий, то виникає ситуація невизначеності. Існують задачі, які для свого розпізнавання не потребують бібліотеки еталонів. У деяких задачах з розпізнавання вхідні дані розділяються на сегменти з подальшим визначенням подібності отриманих частин. Вхідна інформація в цьому разі містить і об’єкт, який необхідно розпізнати, і еталон, з яким він порівнюється. У деяких задачах за еталон приймають або вираз, за яким визначають подібність вхідної та еталонної інформації, або задають умови, за якими можна розпізнати заданий об’єкт. Для розв’язання таких задач бібліотека еталонів не використовується.
To determine the essence of the subject it is used standard information contained in databases which is a structured set of interconnected data of a specific subject area. To find quickly the information it needs, this database should be structured, input data should also be modeled accordingly. Today there are input data models that have their advantages and disadvantages, and each model has its own scope. The article provides examples of problems of semantics that relate to recognition problems. To determine the essence of a particular object, it requires finding its standard in the database. These are speech recognition, child, female, male voice recognition, the problem of clinical diagnostics, comparison of texts on plagiarism, automatic translation of texts from one language to another, etc. There are two ways of comparing the input information and the standard: by the primary signs that describe the object being sought and by the given object. In the second method previous cover by certain signs of the standard and of the object is not conducted. At modeling input data to search for information by the first way the cover of given objects by certain signs takes place. The signs are divided into those that characterize only the given object, by which it is quite simply to define it in the database. In this case the problem is solvable. If the same signs describe different objects, but using differential analysis you can find the the desired object, then this problem is partially solvable. If the same signs characterize different objects and the desired object cannot be identified, then a situation of uncertainty arises. There are problems that do not require a standard library for their recognition. In some recognition problems, which may be semantics problems, the input data is divided into segments, with subsequent determination of the similarity of the resulting parts. In this case, the input data contains both the object to be recognized and the standard with which it is compared. In some problems it is taken as a standard either an expression that determines the similarity of the input data and standard information, or the conditions are specified by which a given object can be recognized. The standard library is not used to solve these problems.
To determine the essence of the subject it is used standard information contained in databases which is a structured set of interconnected data of a specific subject area. To find quickly the information it needs, this database should be structured, input data should also be modeled accordingly. Today there are input data models that have their advantages and disadvantages, and each model has its own scope. The article provides examples of problems of semantics that relate to recognition problems. To determine the essence of a particular object, it requires finding its standard in the database. These are speech recognition, child, female, male voice recognition, the problem of clinical diagnostics, comparison of texts on plagiarism, automatic translation of texts from one language to another, etc. There are two ways of comparing the input information and the standard: by the primary signs that describe the object being sought and by the given object. In the second method previous cover by certain signs of the standard and of the object is not conducted. At modeling input data to search for information by the first way the cover of given objects by certain signs takes place. The signs are divided into those that characterize only the given object, by which it is quite simply to define it in the database. In this case the problem is solvable. If the same signs describe different objects, but using differential analysis you can find the the desired object, then this problem is partially solvable. If the same signs characterize different objects and the desired object cannot be identified, then a situation of uncertainty arises. There are problems that do not require a standard library for their recognition. In some recognition problems, which may be semantics problems, the input data is divided into segments, with subsequent determination of the similarity of the resulting parts. In this case, the input data contains both the object to be recognized and the standard with which it is compared. In some problems it is taken as a standard either an expression that determines the similarity of the input data and standard information, or the conditions are specified by which a given object can be recognized. The standard library is not used to solve these problems.
Опис
Теми
Методы оптимизации и оптимальное управление
Цитування
Некоторые способы моделирования входных данных для поиска информации в библиотеке эталонов при решении задач семантики / Н.К. Тимофеева // Проблемы управления и информатики. — 2020. — № 6. — С. 16-28. — Бібліогр.: 11 назв. — рос.