Uma estratégia para avaliação de desempenho e custo de ambientes big data em infraestruturas de nuvens privadas
Ano de defesa: | 2019 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal Rural de Pernambuco
Departamento de Estatística e Informática Brasil UFRPE Programa de Pós-Graduação em Informática Aplicada |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://www.tede2.ufrpe.br:8080/tede2/handle/tede2/8556 |
Resumo: | A computação em nuvem está emergindo como o principal mecanismo para processar grandes quantidades de dados de forma eficiente. Nesse contexto, as nuvens privadas fornecem infraestruturas que suportam a análise de conjuntos de dados gerados por diferentes fontes, como redes sociais, dados de saúde e dados climatológicos. Compreender como a análise de Big Data se comporta em infraestruturas de nuvem privada, é uma abordagem importante para identificar fatores críticos para o desempenho e custo nestes ambientes. Neste contexto, a avaliação de desempenho e custo propicia o suporte para o gerenciamento destes ambientes considerando métricas de desempenho, como tempos de execução e utilização de processador e de memória de máquinas virtuais da nuvem privada, e métricas de custo, como custo de infraestrutura, de consumo de energia elétrica e de software. Este trabalho apresenta uma estratégia baseada em uma metodologia e modelos para avaliação de desempenho e de custo de ambientes que executam transações Big Data suportados por um pool de recursos provisionados pela infraestrutura de nuvem privada. Uma metologia foi proposta para avaliação de desempenho e custo de ambientes big data na nuvem privada. Essa metodolgia contempla atividades como entendimento e configuração do ambiente Big data na nuvem privada, planejamento de experimentos, medição de desempenho e consumo de energia, modelagem de desempenho e modelagem de custo. Um modelo de desempenho baseado em redes de Petri estocásticas é proposto para avaliar a utilização de processadores e memória de máquinas virtuais e os modelos de custo consideram o custo para implantar uma nuvem privada, custos associados ao consumo de energia da análise dos data sets e custos de relacionados à aquisição de software. O estudo de caso ilustra a aplicabilidade da metodologia, do modelo de desempenho e dos modelos de custo em uma nuvem privada e fornece informações importantes sobre o desempenho e custo, como identificação de fatores que mais impactam na utilização de processadores e de memória de máquinas virtuais e no consumo de energia nestes ambientes. O estudo de caso considerou a análise de um data set composto de opiniões de usuários da rede social Twitter sobre as eleições presidenciais do Brasil em 2018. |