Human-aided Discovery of Ancestral Graphs

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Henrique, Tiago da Silva
Orientador(a): Mesquita, Diego
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Inglês:
Link de acesso: https://hdl.handle.net/10438/36318
Resumo: Quando os dados são escassos, algoritmos de descoberta causal (Causal Discovery, CD) frequentemente inferem relações causais pouco confiáveis que podem contradizer o conhecimento de especialistas. Esse problema é especialmente crítico na presença de variáveis de confusão latentes, devido ao crescimento exponencial da quantidade de grafos candidatos em comparação ao caso sob suficiência causal. Além disso, a falta de quantificação de incerteza na maioria dos métodos de CD dificulta que os usuários diagnostiquem e aprimorem os resultados. Para lidar com essas questões, propomos os Ancestral GFlowNets (AGFNs). Os AGFNs amostram grafos ancestrais (AGs) proporcionalmente a uma distribuição de crença baseada em pontuação, permitindo aos usuários avaliar e propagar a incerteza enquanto levam em conta os confundidores latentes. Além disso, utilizamos os AGFNs para propor uma estrutura de elicitação para refinamentos inferenciais guiados por humanos. Essa estrutura inclui um desenho experimental ótimo para interagir com o especialista e um esquema para incorporar o feedback obtido nos AGFNs via importance sampling. É importante destacar que nosso método é aplicável mesmo em dados com confusão latente — um caso relativamente pouco explorado pela literatura — e pode ser facilmente adaptado para lidar com diferentes tipos de dados, escolhendo uma função valor apropriada. Experimentos com dados observacionais mostram que nosso método amostra com precisão distribuições de AGs e que podemos melhorar significativamente a qualidade da inferência com a ajuda (simulada) de especialistas.