Desenvolvimento de uma Técnica para Estender um SGBD Relacional com Consultas por Similaridade 

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Nesso Junior, Marcos Roberto
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-04022020-111451/
Resumo: Os Sistemas de Gerenciamento de Bases de Dados (SGBD) baseados na Teoria Relacional foram desenvolvidos para atender às necessidades do armazenamento e recuperação de grandes volumes de dados. Esses dados são representados por valores numéricos, datas e/ou pequenas cadeias de caracteres, e são chamados genericamente dados escalares. Com a evolução da tecnologia da informação, torna-se cada vez mais necessário organizar, armazenar e recuperar também outros tipos de dados, a que neste trabalho chamamos de dados complexos, tais como imagens, vídeo, séries temporais e sequências genéticas. As comparações baseadas em Relações de Identidade (RI) ou em Relações de Ordem (RO) são úteis para consultas sobre dados escalares, porém não são adequadas para dados complexos. Para estes, as consultas por similaridade têm sido a opção mais estudada, embora a sua disponibilidade nos SGBDs disponíveis ainda seja limitada. Métodos de Acesso Métrico (MAMs) são usualmente aplicados para a indexação de dados complexos, de modo a agilizar a execução de consultas por similaridade. O presente trabalho de mestrado visou incorporar recursos de um MAM a um SGBD Relacional. Isso foi feito por meio da proposta e implementação de uma técnica para estender um SGBD Relacional de grande utilização. Assim, implementou-se o MAM conhecido como Slim-Tree no PostgreSQL, que é um SGBD Relacional. A implementação da técnica resultou no RAFIKI, um protótipo capaz de superar a sua antecessora KIARA em termos de velocidade, quando usado para realizar consultas por similaridade. A análise experimental realizada mostrou que o RAFIKI é até 6 vezes mais rápido que a KIARA. Utilizando a técnica proposta, é possível a extensão do PostgreSQL para dar suporte a outros MAMs.