Uma abordagem para modelagem de desempenho para sistemas de banco de dados NewSQL e comparação de modelos gerados com diferentes técnicas de aprendizado de máquina

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Cá, Lázaro João
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Ceará
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=83564
Resumo: O uso crescente de aplicativos móveis, redes sociais e muitas outras aplicações web fez surgir uma preocupação com a enorme variedade de dados usados por essas aplicações e com a complexidade dos esquemas de representação desses dados. O problema neste cenário, é que Sistemas de Gerenciamento de Banco de Dados (SGBDs) Relacionais tradicionais (i.e., SGBDs de banco de dados relacionais) não conseguem gerenciar de forma eficiente uma grande massa de dados variáveis. Um dos principais avanços na resolução desses problemas foi o surgimento de tecnologias de sistemas de banco de dados alternativas como o NoSQL e, mais recentemente, o NewSQL, projetados para lidar com o volume, a variedade, a velocidade e a variabilidade das coleções dados. O NewSQL é uma classe de modernos SGBDs Relacionais que fornecem o mesmo desempenho escalável dos sistemas NoSQL para cargas de trabalho de leitura e gravação ao Processamento de Transações On-Line (OLTP), enquanto ainda mantêm as garantias Atomicidade, Consistência, Isolamento e Durabilidade (ACID) de um SGBD Relacional tradicional. Este trabalho propõe uma abordagem de modelagem do desempenho baseada em técnicas de aprendizado de máquina para sistemas de bancos de dados NewSQL. Essa abordagem leva em consideração cargas de trabalho heterogêneas e é capaz de capturar os efeitos não-lineares dos aspectos de concorrência e de distribuição sobre o desempenho. Ela é avaliada num ambiente real, usando um servidor de 64 GB DDR4 RDIMM, 256 GB SSD, 2 TB SAS, 2 Processadores Intel Xeon Silver 4116 e 4 Gbps. Também foi feita comparação do desempenho entre modelos gerados com diferentes técnicas de aprendizado demáquina. Palavras-chave: Modelagem de Desempenho. Aprendizado de Máquina. NewSQL. SLA