Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos
| Main Author: | |
|---|---|
| Publication Date: | 2019 |
| Format: | Bachelor thesis |
| Language: | por |
| Source: | Repositório Institucional da UECE |
| Download full: | https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635 |
Summary: | <div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster. <span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div> |
| id |
UECE-0_40b0180c57245d2fd6b37f7027420b53 |
|---|---|
| oai_identifier_str |
oai:uece.br:94635 |
| network_acronym_str |
UECE-0 |
| network_name_str |
Repositório Institucional da UECE |
| repository_id_str |
|
| spelling |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache MesosBig data Ciência da computação Script<div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster. <span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div><div style="">Data generation is growingmore andmorewith increasing accessibility to technology. Processing this data can yield valuable information, however this task is costly and requires specialized Big Data tools. One such tool is Apache Spark, a clustered computing framework that enables inmemory processing to ensure rapid task execution. To manage a cluster and its processes you can use Kubernetes and Apache Mesos, both of which are managers that help maintain the resources and processes of a cluster. Spark applications can use containers or JVMs for their execution. In this work, Kubernetes uses Docker containers and Mesos uses JVM to perform this functionality. Thus, the proposal is to implement Kubernetes and Apache Mesos as cluster managers, in which Apache Spark will process a large amount of data in a distributed system, in order to evaluate the performance of these tools working in conjunction with purpose of developing a prototype of scripts: one for environment preparation and other for performance measurement of a Spark application in Kubernetes and Mesos. However, due to inexperience, the difficulty of configuring the technologies used and the limitation of the machines used, it was not possible to perform experiments with diversified parameters to get accurate results of Apache Spark performance on these cluster managers. <span style="font-size: 10pt;">Keywords: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div>Universidade Estadual do CearáMarcial Porto Fernandez LIma, Renan Vasconcelos2020-01-07T14:03:07Z2019info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfhttps://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635info:eu-repo/semantics/openAccessporreponame:Repositório Institucional da UECEinstname:Universidade Estadual do Cearáinstacron:UECE2020-01-07T14:03:07Zoai:uece.br:94635Repositório InstitucionalPUBhttps://siduece.uece.br/siduece/api/oai/requestopendoar:2020-01-07T14:03:07Repositório Institucional da UECE - Universidade Estadual do Cearáfalse |
| dc.title.none.fl_str_mv |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| title |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| spellingShingle |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos LIma, Renan Vasconcelos Big data Ciência da computação Script |
| title_short |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| title_full |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| title_fullStr |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| title_full_unstemmed |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| title_sort |
Um estudo de caso: uma avaliação de desempenho do Apache Spark no orquestrador Kubernetes e no Apache Mesos |
| author |
LIma, Renan Vasconcelos |
| author_facet |
LIma, Renan Vasconcelos |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Marcial Porto Fernandez |
| dc.contributor.author.fl_str_mv |
LIma, Renan Vasconcelos |
| dc.subject.por.fl_str_mv |
Big data Ciência da computação Script |
| topic |
Big data Ciência da computação Script |
| description |
<div style="">A geração de dados está crescendo cada vez mais com o aumento da acessibilidade à tecnologia. O processamento desses dados pode gerar informações valiosas, entretanto essa tarefa é custosa e necessita de ferramentas especializadas em Big Data. Uma dessasferramentas é o Apache Spark, um framework de computação em cluster, que permite processamento na memória, garantindo uma rápida execução da tarefa. Para gerenciar um cluster e seus processos pode-se usar do Kubernetes e do Apache Mesos, ambos são gerenciadores que auxiliam a manutenção dos recursos e dos processos de um cluster. As aplicações do Spark podem utilizar containers ou JVMs para sua execução. Neste trabalho, o Kubernetesfaz o uso de containers Docker e o Mesos utiliza JVM para realizar essa funcionalidade. Assim, a proposta consiste em implementar o Kubernetes e o Apache Mesos como gerenciadores de cluster, no qual o Apache Spark realizará o processamento de uma grande quantidade de dados num sistema distribuído, com o intuito de avaliar o desempenho dessas ferramentas trabalhando em conjunto com a finalidade de desenvolver um protótipo dos scripts: um de preparação do ambiente e outro para medição de desempenho de uma aplicação Spark no Kubernetes e no Mesos. Entretanto, devido a inexperiência, a dificuldade de configurar as tecnologias utilizadas e a limitação das máquinas utilizadas, não foi possível realizar experimentos com parâmetros diversificados para conseguir resultados precisos do desempenho do Apache Spark nos gerenciadores de cluster. <span style="font-size: 10pt;">Palavras-chave: Big Data. Apache Spark. Kubernetes. Apache Mesos. Script.</span></div> |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019 2020-01-07T14:03:07Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635 |
| url |
https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=94635 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Estadual do Ceará |
| publisher.none.fl_str_mv |
Universidade Estadual do Ceará |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UECE instname:Universidade Estadual do Ceará instacron:UECE |
| instname_str |
Universidade Estadual do Ceará |
| instacron_str |
UECE |
| institution |
UECE |
| reponame_str |
Repositório Institucional da UECE |
| collection |
Repositório Institucional da UECE |
| repository.name.fl_str_mv |
Repositório Institucional da UECE - Universidade Estadual do Ceará |
| repository.mail.fl_str_mv |
|
| _version_ |
1828295952193028096 |