Planejamento de infraestrutura computacional para SGBDs NoSQL

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: SOUZA, Patrícia Dayana de Araújo
Orientador(a): TAVARES, Eduardo Antônio Guimarães
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Informacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/35859
Resumo: Os Sistemas de Gerenciamento de Banco de Dados (SGBDs)NoSQL vêm sendo, cons-tantemente, objeto de estudo por serem os mais adequados para trabalhar com grandes volumes de dados e requisições, atendendo, assim, a demandas da Internet das Coisas (IoT) e a aplicações e serviços que integram o Big Data (Facebook, Google e Amazon), principalmente por sua capacidade de crescer e se adaptar à carga recebida. Contudo, esses SGBDs são sistemas distribuídos, dessa forma, a comunicação pode ser um gargalo de desempenho. Para garantir disponibilidade, consistência e, em alguns casos, distribuir o desempenho, os SGBDs NoSQL fazem uso, especialmente, do processo de replicação de dados. Embora a replicação seja importante, esse mecanismo pode ocasionar uma sobre- carga da rede, em virtude dos muitos acessos ao nó principal ou por concorrência de outras aplicações na largura de banda disponível, fazendo com que a propagação das réplicas seja interrompida ou que ocorram falhas de consistência na leitura dos nós secundários (como resultado de um failover automatizado). Nesse sentido, e tendo em vista a popularização dos SGBDs NoSQL, a ausência de trabalhos que avaliem a comunicação envolvendo esses sistemas e a modelagem focada no desempenho - que é útil para tomada decisões em aná- lises de sistemas e prover uma economia de tempo, dinheiro e/ou trabalho experimental - esta pesquisa propõe modelos baseados em Redes de Petri Estocásticas e uma análise experimental, com o objetivo de avaliar o desempenho de cluster NoSQL sob um link de rede para contribuir no planejamento da infraestrutura computacional para SGBDs NoSQL, principalmente no tocante à utilização da rede de comunicação. Acreditando ser um diferencial, embora com uma abstração simplista do paradigma SDN, especificamente, a implementação de técnicas de QoS com OpenFlow para limitar ou priorizar o tráfego de um cluster de banco de dados, ressaltamos que os modelos GSPN gerados neste trabalho, bem como a análise de alguns estudos auxiliam no desempenho da comunicação dos SGBDs NoSQL, além da quantidade de requisições processadas, da taxa de chegada da carga recebida, da replicação dos dados, do tráfego concorrente na largura de banda, do nível de consistência configurada para o banco e da quantidade de nós envolvidos na replicação.