Метод обробки неструктурованої інформації на веб-ресурсах
Завантаження...
Дата
Автори
Назва журналу
Номер ISSN
Назва тому
Видавець
Інститут кібернетики ім. В.М. Глушкова НАН України
Анотація
З часом стає складно знайти інформацію в мережі Інтернет, яка зацікавила раніше, навіть якщо відомо, на якому ресурсі вона була розміщена. Пошук відбувається за заданими параметрами, якщо інформація, що знаходиться на ресурсі, є структурованою та систематизованою. Якщо ж це не так, пошук значно ускладнюється, часто й уповільнюється, через що користувач перериває сесію пошуку та оновлює параметри вибору. Тому багато інформації, що знаходиться в мережі, не потрапляє до результатів запитів користувачів. Задачею цієї статті є представлення методу обробки обсягу неструктурованої неперервної, дискретизованої, регулярної та випадкової інформації на веб-ресурсах у вигляді чітко структурованого набору розподілених даних. У роботі аналізується можливість формування масиву інформації як кількості точок — джерел інформації. У цьому випадку для реалізації процесу структуризації найбільш універсальним є адаптивний алгоритм, який додаватиме нові точки — джерела інформації для її обробки веб-сервісом або для пошуку в масивах неструктурованої та слабо систематизованої інформації в залежності від розподілу вхідних даних. Зокрема, пропонується Z-перетворення, оскільки методи Z-апроксимації початково базуються на адаптивних алгоритмах, здатних змінювати свої функціональні особливості та при цьому надавати змінну точність обчислень. Особливістю вирішення поставленої задачі є приведення неперервної, дискретизованої, регулярної та випадкової інформації з її обробкою в цьому процесі до необхідного формату, що математично можна описати окремими функціями, які й використовуватимуться в алгоритмах обробки. Зазначене може бути використане для розробки веб-сервісів обробки інформації для довідкових, пошукових, рекомендаційних систем та платформ дистанційного навчання, а також для вдосконалення алгоритмів обробки та відображення інформації для прикладного програмного забезпечення роботи браузерів.
Over time, it becomes difficult to find information on the Internet that was previously of interest, even if it is known on which resource it was placed. The search is carried out according to the given parameters if the information on the resource is structured and systematized. However, if this is not the case, the search becomes significantly more difficult, often slower, which leads to the user interrupting the search session and updating the selection parameters. As a result, much of the information available on the web does not appear in the search results. The task of this article is to present a method for processing the volume of unstructured, continuous, discretized, regular, and random information on web resources into a clearly structured set of distributed data. The work analyzes the possibility of forming an information array as a number of points — sources of information. In this case, the most universal approach to implement the structuring process is an adaptive algorithm that adds new points — sources of information for processing by the web service or for searching in arrays of unstructured and poorly systematized information depending on the distribution of input data. In particular, Z-transformation is proposed, as Z-approximation methods are initially based on adaptive algorithms capable of changing their functional features while providing variable calculation accuracy. The uniqueness of solving the given task lies in converting continuous, discretized, regular, and random information, processing it in this process, and transforming it into the required format, which can be mathematically described by separate functions to be used in processing algorithms. This can be used for the development of web services for information processing for reference, search, recommendation systems, and e-learning platforms, as well as for improving the algorithms for processing and displaying information for application software for browser operations.
Over time, it becomes difficult to find information on the Internet that was previously of interest, even if it is known on which resource it was placed. The search is carried out according to the given parameters if the information on the resource is structured and systematized. However, if this is not the case, the search becomes significantly more difficult, often slower, which leads to the user interrupting the search session and updating the selection parameters. As a result, much of the information available on the web does not appear in the search results. The task of this article is to present a method for processing the volume of unstructured, continuous, discretized, regular, and random information on web resources into a clearly structured set of distributed data. The work analyzes the possibility of forming an information array as a number of points — sources of information. In this case, the most universal approach to implement the structuring process is an adaptive algorithm that adds new points — sources of information for processing by the web service or for searching in arrays of unstructured and poorly systematized information depending on the distribution of input data. In particular, Z-transformation is proposed, as Z-approximation methods are initially based on adaptive algorithms capable of changing their functional features while providing variable calculation accuracy. The uniqueness of solving the given task lies in converting continuous, discretized, regular, and random information, processing it in this process, and transforming it into the required format, which can be mathematically described by separate functions to be used in processing algorithms. This can be used for the development of web services for information processing for reference, search, recommendation systems, and e-learning platforms, as well as for improving the algorithms for processing and displaying information for application software for browser operations.
Опис
Теми
Методи обробки та захисту інформації
Цитування
Метод обробки неструктурованої інформації на веб-ресурсах / О.М. Трофимчук, О.О. Кряжич // Проблеми керування та інформатики. — 2022. — № 4. — С. 106-115. — Бібліогр.: 16 назв. — укр.