CSB-Index: um índice espacial para data warehouses geográficos na nuvem

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Mateus, Rodrigo Costa
Orientador(a): Times, Valéria Cesário
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/12368
Resumo: Plataformas de computação em nuvem proveem escalabilidade, elasticidade e tolerância a falhas aos sistemas computacionais. Além disso, elas foram projetadas para lidar com grande volume de dados utilizando recursos computacionais quase ilimitados. Data Warehouse Geográfico (DWG) se tornou uma das principais tecnologias de suporte à decisão, pois promove a integração do Data Warehouse convencionais, das ferramentas On-Line Analytical Processing e dos Sistemas de Informações Geográficas. Por esse motivo, um DWG viabiliza a análise no contexto espacial aliada à execução de consultas multidimensionais envolvendo grande volume de dados. A combinação da computação em nuvem e dos DWG traz consigo o desafio de prover análises de dados espaciais em um ambiente distribuído. Além disso, há a preocupação com o desempenho no processamento de consultas, que utilizam janelas de consultas espaciais ad-hoc e realizam várias junções entre as tabelas de dimensões e de fatos. Embora existam eficientes mecanismos para aumentar o desempenho do processamento de consultas em DWG, como as estruturas de indexação, elas se tornam impróprias aos DWG mantidos em nuvem porque estes mecanismos não lidam com a recuperação de dados em ambientes distribuídos. Nesta dissertação, propõe-se um novo índice para DWG mantidos em nuvem chamado CSB-Index (Cloud Spatial- Bitmap Index). O CSB-Index se baseia no SB-Index e permite a recuperação de dados mantidos em um ambiente distribuído, pois mantém em sua estrutura referências aos bancos de dados que compõe o DWG. Além disso, ele introduz o uso do Índice Bitmap de Junção aos DWG armazenados em nuvem, evitando o processamento das custosas operações de junção estrela. A viabilidade do CSB-Index foi comprovada por meio de testes experimentais de desempenho e escalabilidade. Comparações entre diferentes métodos de acesso indicaram que o CSB-Index diminuiu significativamente o tempo de resposta do processamento de consultas roll-up e drilldown relacionadas aos predicados espaciais “intersecta”, “está contido” e “contém”, possibilitando redução no tempo de processamento destas consultas de 58,2% até 99,65%. Também foi verificado que a escalabilidade dos dados e do número de máquinas que armazenam o DWG não afetam negativamente o desempenho do CSB-Index. Por fim, este trabalho também investigou o impacto do uso das federações no processamento das consultas SOLAP e comprovou que está técnica possibilita maior desempenho ao processamento destas consultas.