Representação e execução de consultas por similaridade em SQL Padrão

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Siqueira, Pedro Henrique Braga
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.uel.br/handle/123456789/13804
Resumo: Resumo: Esta Dissertação aborda o armazenamento e a recuperação de dados complexos em SGBDRs (Sistemas de Gerenciamento de Banco de Dados Relacionais), que depende de funções de distância para a avaliação da dissimilaridade dos dados Neste sentido, um conjunto de ferramentas que armazenam dados complexos e utilizam operadores por similaridade na recuperação dos mesmos foram desenvolvidas em trabalhos anteriores Entretanto, tanto a análise empírica de estratégias para armazenamento de dados complexos quanto a definição de uma representação adequada para operadores por similaridade ainda são questões em aberto na literatura Este trabalho busca preencher essas lacunas através da classificação, implementação e avaliação de abordagens existentes para armazenamento de dados complexos de acordo com quatro abordagens suportadas pela linguagem SQL (Structured Query Language) padrão, a saber relacional,objeto-relacional, binário e semi-estruturado Além disso, também é discutida uma representação abrangente para operadores por similaridade para recuperação de dados complexos que é consistente com o padrão SQL É apresentada uma representação para funções de distância, que permite ao processador de consultas do SGBDR detectar e executar operadores por similaridade físicos Foram avaliados a recuperação, inserção e armazenamento de dados complexos em diferentes cenários, considerando tabelas de entrada de diferentes tamanhos e dados complexos de diferentes dimensionalidades Nestes cenários foram consideradas também três funções de distância que apresentam diferentes custos computacionais Os resultados experimentais indicam que (i) as estruturas relacionais e objeto-relacionais superam em eficiência os outros dois concorrentes na maioria dos cenários, enquanto (ii) a estratégia objeto-relacional além de apresentar bom desempenho permite o uso de uma representação mais limpa