Uma análise comparativa de ambientes para Big Data: Apche Spark e HPAT

Detalhes bibliográficos
Ano de defesa:	2018
Autor(a) principal:	Carvalho, Rafael Aquino de
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Apache Spark Apache Spark. Arcabouços de Big Data Big data frameworks Comparação de desempenho HPAT Performance comparison
Link de acesso:	http://www.teses.usp.br/teses/disponiveis/45/45134/tde-15062018-110116/
Resumo:	Este trabalho compara o desempenho e a estabilidade de dois arcabouços para o processamento de Big Data: Apache Spark e High Performance Analytics Toolkit (HPAT). A comparação foi realizada usando duas aplicações: soma dos elementos de um vetor unidimensional e o algoritmo de clusterização K-means. Os experimentos foram realizados em ambiente distribuído e com memória compartilhada com diferentes quantidades e configurações de máquinas virtuais. Analisando os resultados foi possível concluir que o HPAT tem um melhor desempenho em relação ao Apache Spark nos nossos casos de estudo. Também realizamos uma análise dos dois arcabouços com a presença de falhas.

Registros relacionados