Busca por similaridade utilizando grafo de interações NK

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Moraes, José Carlos Bueno de
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-09022021-153946/
Resumo: Com o crescimento do volume de dados ao longo dos anos, foram desenvolvidas técnicas de busca por similaridade para responder às necessidades dos usuários de diversos segmentos. A evolução das técnicas de busca por similaridade vem permitindo recuperar objetos presentes em grandes bases de dados similares a um objeto fornecido pelo usuário, auxiliando na tomada de decisão cada vez mais correta utilizada em diversos segmentos de estudo e aplicação. Um método de busca por similaridade baseado no grafo de interações NK é proposto. O grafo de interações NK foi originalmente empregado para agrupamento e é construído com base na distância e densidade espacial dos objetos em um conjunto de dados. Duas variações do método são investigadas. Nas duas variações, k objetos são retornados visitando-se vértices do grafo de interações NK a partir do vértice inicial relacionado ao exemplo do conjunto de dados que está mais próximo do objeto a ser consultado. No método NK A, os k objetos relacionados a vértices com arestas incidentes ao vértice inicial são retornados. No método NK B, k vértices são visitados a partir do vértice inicial. O próximo vértice visitado é aquele com aresta incidente ao vértice atual e que está mais próximo do novo objeto a ser consultado. Os k objetos relacionados aos vértices visitados são retornados. Os algoritmos propostos são comparados entre si e com a busca por similaridade baseada apenas na distância. Os resultados experimentais indicam que os métodos propostos apresentam bom desempenho quando existem agrupamentos com formas arbitrárias no conjunto de dados.