Некоторые программные среды аналитики больших данных

Урсатьев, А.А.

Некоторые программные среды аналитики больших данных

dc.contributor.author	Урсатьев, А.А.
dc.date.accessioned	2017-02-06T15:28:50Z
dc.date.available	2017-02-06T15:28:50Z
dc.date.issued	2016
dc.description.abstract	Изложены концептуальные вопросы построения сред обработки данных – кластерных систем на программной платформе Hadoop. Описана инфраструктура HadoopMapReduce для организации параллельных распределенных вычислений над данны ми и показано эволюционное преобразование платформы Hadoop применительно к интерактивным и потоковым динамиче ским нагрузкам.	uk_UA
dc.description.abstract	Викладено концептуальні питання побудови середовищ обробки даних – кластерных систем на програмній платформі Hadoop. Описано інфраструктуру HadoopMapReduce для організації паралельних розподілених обчислень над даними і показано ево люційне перетворення платформи Hadoop стосовно інтерактивних і потокових динамічних навантажень.	uk_UA
dc.description.abstract	improvement of the traditional processing technology and to create the advanced analytics environments. The conceptual issues of data media construction, in particular, on the Hadoop cluster system software platform is presented. The HadoopMapReduce infrastructure is described for the parallel distributed computing on the data and the evolutionary transformation of Hadoop platform using the infrastructure and streaming dynamic loads, as well as HadoopMapReduce infrastructure constraints. It is shown that an introduction of YARN (Yet Another Resource Negotiator) on the computing Hadoop platform allows to perform the different workloads in a linearly scalable cluster Hadoop YARN (Hadoop 2.0), achieving calculations of the high efficiency. Frameworks, Spark, Tez and Storm use the possibility of YARN . The components that make a total Hadoop 2.0 de facto the standard technology for working with Big Data are analyzed. These are the constructions Hive for design-oriented interactive queries to SQL-like language HQL (Hive query language) and working with large data storage; Pig – a high-level procedure language Pig Latin, designed for accessing the semidistributed lennym datasets; HBase – distributed non-relational DBMS, working effectively with the individual records in real time; Apache Accumulo – oriented on a high level of safety distributed, scalable data repository with the strict requirements of the information and personal data protection. The problems of large data efficiently various types download of Hadoop ecosystem using Hive and Pig. A comparative analysis of ELT (extract-load-transform) and ETL	uk_UA
dc.identifier.citation	Некоторые программные среды аналитики больших данных / А.А. Урсатьев // Управляющие системы и машины. — 2016. — № 3. — С. 29-42. — Бібліогр.: 33 назв. — рос.	uk_UA
dc.identifier.issn	0130-5395
dc.identifier.udc	004.7:004.75:004.9:004.738.5
dc.identifier.uri	https://nasplib.isofts.kiev.ua/handle/123456789/113330
dc.language.iso	ru	uk_UA
dc.publisher	Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України	uk_UA
dc.relation.ispartof	Управляющие системы и машины
dc.status	published earlier	uk_UA
dc.subject	Методы и средства обработки данных и знаний	uk_UA
dc.title	Некоторые программные среды аналитики больших данных	uk_UA
dc.title.alternative	Деякі програмні середовища аналітики великих даних	uk_UA
dc.title.alternative	SomeFrameworks forAnalytics Big Data	uk_UA
dc.type	Article	uk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1

Назва:: 4-Oursatyev.pdf
Розмір:: 1.02 MB
Формат:: Adobe Portable Document Format

Завантажити

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1

Назва:: license.txt
Розмір:: 817 B
Формат:: Item-specific license agreed upon to submission
Опис:

Завантажити

Колекція

Управляющие системы и машины, 2016, № 3