Completação fora de amostra em grafos de conhecimento

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Silva, Daniel Nascimento Ramos da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/377
Resumo: Grafos de conhecimento fornecem uma camada semântica valiosa para várias aplicações ao representarem fatos como uma rede de relacionamentos entre entidades. No entanto, muitos dos fatos de interesse podem estar ausentes do grafo, potencialmente prejudicando o desempenho dessas aplicações. Diante disso, diversas estratégias para completar, isto é, inferir o valor verdade desses fatos, foram desenvolvidas ao longo dos últimos anos. Em particular, o emprego de técnicas baseadas em Aprendizado de Representações tornou-se a abordagem mais frequente de completação. Contudo, em sua maioria, essas técnicas não podem realizar inferências envolvendo entidades emergentes, não observadas no momento de treino, o que é incompatível com o caráter evolutivo de grafos de conhecimento. Uma estratégia promissora para este cenário remove tais limitações ao basear-se no uso da circunvizinhança do relacionamento de interesse — chamada de contexto de consulta — como evidência para o seu valor verdade. Entretanto, ela permanece pouco explorada. Diante disso, nesta tese é investigada a tarefa de completação fora de amostra, a qual remove a restrição sob o conjunto de entidades. É desenvolvida e avaliada empiricamente uma metodologia baseada no uso de contextos de consulta e Aprendizado de Represen- tações. São avaliadas técnicas de construção desses contextos, assim como desenvolvidas arquiteturas de rede neurais artificiais. Além disso, são elaboradas técnicas de seleção de consultas, as quais mitigam o custo computacional associado a essa classe de método. São realizados experimentos abrangentes, que lançam luz sobre os desafios do método e indicam que o método proposto é competitivo com o estado da arte.