Эффективность применения языков программирования в фреймворке Apache Hadoop с использованием MapReduce

dc.contributor.authorГлибовец, А.Н.
dc.contributor.authorДмитрук, Я.О.
dc.date.accessioned2017-02-07T20:48:53Z
dc.date.available2017-02-07T20:48:53Z
dc.date.issued2016
dc.description.abstractИсследована эффективность использования различных языков для фреймворка Apache Hadoop с целью обработки больших коллекций данных на базе модели MapReduce. Акцент сделан на анализе скорости выполнения программ в Hadoop-кластере. Проведено сравнение различных проектов по экосистеме Hadoop для распределенных вычислений. Описанные эксперименты подтвердили преимущество использования Apache Spark. Установлено, что преимущество в скорости MapReduce-программ, написанных на Java- или другом JVM-языке, существенны.uk_UA
dc.description.abstractДосліджено ефективність використання різних мов програмування у фреймворку Apache Hadoop для обробки великих колекцій даних з використанням моделі MapReduce. Акцент зроблено на аналізі швидкості виконання програм у Hadoopкластері. Проведено порівняння різних проектів із екосистеми Hadoop для розподілених обчислень. Описано експерименти, які підтвердили переваги використання Apache Spark. Встановлено, що перевага у швидкості MapReduce-програм, написаних на Java- або іншій JVM-мові над іншими, є суттєвою.uk_UA
dc.description.abstractThe effectiveness of the different languages for Apache Hadoop framework to process large data collections based on the MapReduce model is discussed. Apache Hadoop is used in many industrial projects all over world such as Facebook and Yahoo!. It provides the ability to process different tasks effectively and reliably on the cluster to handle the huge amounts of data. MR model allows the developers to ignore the complex architectures by cluster management, and immediately to develop a program. This work investigates the influence of the programming language on the speed of the program in the Apache Hadoop framework. The subject of comparison is the execution of programs in Java, Scala and Python that implements the solution of the simple problem: how long each word in the input collection of text documents is searched. All three programs, in spite of the language, is written in the same style, so that the comparison results are objective. For the experiments, we have chosen the image of ClouderaQuickstart VM virtual machine. The easy use of this virtual machine is that it is already established Hadoop, HDFS, and other services. Also, a cluster of three nodes is created for the study. CDH is elected as the distribution of Apache Hadoop and related projects. The desired configuration on each node is set. Each program is ran for the different size input: 8Mb, 34Mb, 61Mb, 106Mb and 203Mb. During the experiments, the best results is showed by the program that is written in the Apache Spark. In addition, it is found that the MR program in the Apache Hadoop is better to write in Java or any other JVM languages than Python. An advantage in speed is obvious. Also, experiments shows that the processing speed is larger at higher input collections. So, it is not necessary to use Hadoop to work with small data.uk_UA
dc.identifier.citationЭффективность применения языков программирования в фреймворке Apache Hadoop с использованием MapReduce / А.Н. Глибовец, Я.О. Дмитрук // Управляющие системы и машины. — 2016. — № 5. — С. 84-92. — Бібліогр.: 10 назв. — рос.uk_UA
dc.identifier.issn0130-5395
dc.identifier.udc681.3:658.56
dc.identifier.urihttps://nasplib.isofts.kiev.ua/handle/123456789/113403
dc.language.isoruuk_UA
dc.publisherМіжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН Україниuk_UA
dc.relation.ispartofУправляющие системы и машины
dc.statuspublished earlieruk_UA
dc.subjectПрограммная инженерия и программные средстваuk_UA
dc.titleЭффективность применения языков программирования в фреймворке Apache Hadoop с использованием MapReduceuk_UA
dc.title.alternativeЕфективність застосування мов програмування в фреймворку Apache Hadoop з використанням MapReduceuk_UA
dc.title.alternativeThe Effectiveness of Programming Languages in the Apache Hadoop MapReduce Frameworkuk_UA
dc.typeArticleuk_UA

Файли

Оригінальний контейнер

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
10-Glybovets.pdf
Розмір:
694.28 KB
Формат:
Adobe Portable Document Format

Контейнер ліцензії

Зараз показуємо 1 - 1 з 1
Завантаження...
Ескіз
Назва:
license.txt
Розмір:
817 B
Формат:
Item-specific license agreed upon to submission
Опис: