A semantic rank-based graph embedding

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Fernando, Filipe Alves de [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/194497
Resumo: Grafos são ferramentas poderosas, capazes de capturar relações complexas existentes entre objetos. Em decorrência de sua robustez e flexibilidade, diversas aplicações podem beneficiar-se de modelagens baseadas em grafos. No entanto, o processamento de grafos, principalmente em cenários de larga escala, é computacionalmente custoso e muitas vezes inviável. Métodos de Graph Embedding são usados para encontrar representações vetoriais de baixa dimensionalidade para grafos, preservando suas características principais como topologia, afinidade e vizinhança compartilhada entre nós, possibilitando que tarefas analíticas como classificação, agrupamento, recuperação de informações, predição de conexões e outras possam ser executadas. Com isso em mente, este trabalho, propõe RaDE (Rank Diffusion Embedding), um método eficiente e eficaz para aprender representações vetoriais de baixa dimensionalidade de nós de grafos. O método proposto identifica representantes altamente eficazes em grafos baseados em modelagens de ranqueamento, além de ser totalmente não supervisionado e independente do domínio de dados. Uma vantagem do RaDE sobre os métodos concorrentes é que cada dimensão das representações vetoriais geradas possui um significado semântico. Além do RaDE, este trabalho também propõe o RaDE+, que é uma variante do RaDE. O RaDE+ considera múltiplos representantes ao invés de um único por dimensão. A abordagem proposta foi avaliada em 8 conjuntos de dados tais como redes sociais, redes de co-referências, documentos textuais e conjuntos de imagem. Destacando que um dos conjuntos de dados avaliados é um conjunto de images de raio-x de pulmões de pessoas com Covid-19, pneumonia e saudáveis. O RaDE/RaDE+ foram aplicados neste conjunto de dados para ambas as tarefas: visualização e recuperação de informação e as representações vetoriais geradas por ambos os métodos alcançaram resultados de alta eficácia, superando os resultados do métodos concorrentes na maioria dos conjuntos de dados.