Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos

Bibliographic Details
Main Author: LIma, Renan Vasconcelos
Publication Date: 2019
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UECE
Download full: https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635
Summary: <div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster.&nbsp;<span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>
id UECE-0_40b0180c57245d2fd6b37f7027420b53
oai_identifier_str oai:uece.br:94635
network_acronym_str UECE-0
network_name_str Repositório Institucional da UECE
repository_id_str
spelling Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache MesosBig data Ciência da computação Script<div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster.&nbsp;<span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div><div style="">Data generation is growingmore andmorewith increasing accessibility to technology. Processing this data can yield valuable information, however this task is costly and requires specialized Big Data tools. One such tool is Apache Spark, a clustered computing framework that enables inmemory processing to ensure rapid task execution. To manage a cluster and its processes you can use Kubernetes and Apache Mesos, both of which are managers that help maintain the resources and processes of a cluster. Spark applications can use containers or JVMs for their execution. In this work, Kubernetes uses Docker containers and Mesos uses JVM to perform this functionality. Thus, the proposal is to implement Kubernetes and Apache Mesos as cluster managers, in which Apache Spark will process a large amount of data in a distributed system, in order to evaluate the performance of these tools working in conjunction with purpose of developing a prototype of scripts: one for environment preparation and other for performance measurement of a Spark application in Kubernetes and Mesos. However, due to inexperience, the difficulty of configuring the technologies used and the limitation of the machines used, it was not possible to perform experiments with diversified parameters to get accurate results of Apache Spark performance on these cluster managers.&nbsp;<span style="font-size: 10pt;">Keywords: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>Universidade Estadual do CearáMarcial Porto Fernandez LIma, Renan Vasconcelos2020-01-07T14:03:07Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UECEinstname:Universidade Estadual do Cearáinstacron:UECE2020-01-07T14:03:07Zoai:uece.br:94635Repositório InstitucionalPUBhttps://siduece.uece.br/siduece/api/oai/requestopendoar:2020-01-07T14:03:07Repositório Institucional da UECE - Universidade Estadual do Cearáfalse
dc.title.none.fl_str_mv Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
spellingShingle Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
LIma, Renan Vasconcelos
Big data
Ciência da computação
Script
title_short Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_full Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_fullStr Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_full_unstemmed Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
title_sort Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
author LIma, Renan Vasconcelos
author_facet LIma, Renan Vasconcelos
author_role author
dc.contributor.none.fl_str_mv Marcial Porto Fernandez
dc.contributor.author.fl_str_mv LIma, Renan Vasconcelos
dc.subject.por.fl_str_mv Big data
Ciência da computação
Script
topic Big data
Ciência da computação
Script
description <div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster.&nbsp;<span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>
publishDate 2019
dc.date.none.fl_str_mv 2019
2020-01-07T14:03:07Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635
url https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Estadual do Ceará
publisher.none.fl_str_mv Universidade Estadual do Ceará
dc.source.none.fl_str_mv reponame:Repositório Institucional da UECE
instname:Universidade Estadual do Ceará
instacron:UECE
instname_str Universidade Estadual do Ceará
instacron_str UECE
institution UECE
reponame_str Repositório Institucional da UECE
collection Repositório Institucional da UECE
repository.name.fl_str_mv Repositório Institucional da UECE - Universidade Estadual do Ceará
repository.mail.fl_str_mv
_version_ 1828295952193028096