Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos

LIma, Renan Vasconcelos

Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos

Bibliographic Details
Main Author:	LIma, Renan Vasconcelos
Publication Date:	2019
Format:	Bachelor thesis
Language:	por
Source:	Repositório Institucional da UECE
Download full:	https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635
Summary:	<div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster. <span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>

Item metadata

id	UECE-0_40b0180c57245d2fd6b37f7027420b53
oai_identifier_str	oai:uece.br:94635
network_acronym_str	UECE-0
network_name_str	Repositório Institucional da UECE
repository_id_str
spelling	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache MesosBig data Ciência da computação Script<div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster. <span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div><div style="">Data generation is growingmore andmorewith increasing accessibility to technology. Processing this data can yield valuable information, however this task is costly and requires specialized Big Data tools. One such tool is Apache Spark, a clustered computing framework that enables inmemory processing to ensure rapid task execution. To manage a cluster and its processes you can use Kubernetes and Apache Mesos, both of which are managers that help maintain the resources and processes of a cluster. Spark applications can use containers or JVMs for their execution. In this work, Kubernetes uses Docker containers and Mesos uses JVM to perform this functionality. Thus, the proposal is to implement Kubernetes and Apache Mesos as cluster managers, in which Apache Spark will process a large amount of data in a distributed system, in order to evaluate the performance of these tools working in conjunction with purpose of developing a prototype of scripts: one for environment preparation and other for performance measurement of a Spark application in Kubernetes and Mesos. However, due to inexperience, the difficulty of configuring the technologies used and the limitation of the machines used, it was not possible to perform experiments with diversified parameters to get accurate results of Apache Spark performance on these cluster managers. <span style="font-size: 10pt;">Keywords: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>Universidade Estadual do CearáMarcial Porto Fernandez LIma, Renan Vasconcelos2020-01-07T14:03:07Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UECEinstname:Universidade Estadual do Cearáinstacron:UECE2020-01-07T14:03:07Zoai:uece.br:94635Repositório InstitucionalPUBhttps://siduece.uece.br/siduece/api/oai/requestopendoar:2020-01-07T14:03:07Repositório Institucional da UECE - Universidade Estadual do Cearáfalse
dc.title.none.fl_str_mv	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
spellingShingle	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos LIma, Renan Vasconcelos Big data Ciência da computação Script
title_short	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_full	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_fullStr	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_full_unstemmed	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_sort	Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
author	LIma, Renan Vasconcelos
author_facet	LIma, Renan Vasconcelos
author_role	author
dc.contributor.none.fl_str_mv	Marcial Porto Fernandez
dc.contributor.author.fl_str_mv	LIma, Renan Vasconcelos
dc.subject.por.fl_str_mv	Big data Ciência da computação Script
topic	Big data Ciência da computação Script
description	<div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster. <span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>
publishDate	2019
dc.date.none.fl_str_mv	2019 2020-01-07T14:03:07Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/bachelorThesis
format	bachelorThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635
url	https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Universidade Estadual do Ceará
publisher.none.fl_str_mv	Universidade Estadual do Ceará
dc.source.none.fl_str_mv	reponame:Repositório Institucional da UECE instname:Universidade Estadual do Ceará instacron:UECE
instname_str	Universidade Estadual do Ceará
instacron_str	UECE
institution	UECE
reponame_str	Repositório Institucional da UECE
collection	Repositório Institucional da UECE
repository.name.fl_str_mv	Repositório Institucional da UECE - Universidade Estadual do Ceará
repository.mail.fl_str_mv
_version_	1828295952193028096

Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos

Similar Items