Uma abordagem híbrida para detecção de relacionamentos causais aplicados à descoberta baseada em literatura

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Vasques, Dildre Georgiana
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-20042022-141047/
Resumo: A quantidade de conhecimento acumulada em artigos científicos leva os pesquisadores a lidar com um número expressivo de publicações e a sua fragmentação em diferentes campos de especialidades ou disciplinas. No entanto, é possível fazer a conexão entre essas áreas por meio da Descoberta Baseada em Literatura. Essa abordagem tem como objetivo relacionar diferentes especialidades, a fim de encontrar relacionamentos implícitos potencialmente utilizáveis para o levantamento de novas hipóteses científicas. Para viabilizar esse processo e deixá-lo mais rápido e eficaz, a Descoberta Baseada em Literatura conta com o auxílio de técnicas de Mineração de Textos. Apesar de todo o progresso obtido nessas áreas, os pesquisadores ainda precisam lidar com a falta de explicações lógicas sobre as relações encontradas. Pesquisas recentes têm apresentado diversos avanços nesse sentido com o auxílio de técnicas baseadas em análises linguísticas, com foco em abordagens semânticas. Porém, a incorporação de uma abordagem que considere e explique os relacionamentos de causa e efeito entre os conceitos ainda é um desafio a ser superado. Nesse contexto, esta tese de doutorado foi motivada pelo potencial da semântica verbal e da representação do conhecimento em mapas conceituais, a fim de fornecer explicações detalhadas sobre os mecanismos de interação causal existentes entre os conceitos. O desenvolvimento deste trabalho teve o propósito geral de avançar as pesquisas na área da Descoberta Baseada em Literatura com foco da detecção de relacionamentos causais. Para isso, foi desenvolvida uma abordagem híbrida, baseada em análises estatísticas e linguísticas. Experimentos realizados revelaram que as técnicas estatísticas baseadas em regras de associação e métricas de redes complexas possibilitam a seleção dos conceitos mais representativos do corpus, enquanto as técnicas baseadas em análises linguísticas, com foco em semântica verbal, favorecem a extração de relações causais. Essas relações, quando representadas em mapas conceituais, compõem uma cadeia lógica de conexões, fornecendo uma saída facilmente interpretável. Esse modelo de representação auxilia a detecção de links ocultos e a descoberta de conhecimento por parte do usuário. Os resultados relatados nesta tese fornecem evidências de que a abordagem é eficaz para reconstruir e explicar hipóteses de descobertas baseadas na literatura histórica, além de facilitar o teste e a geração de novas hipóteses. Esses resultados mostram os benefícios que uma abordagem híbrida de Mineração de Textos pode proporcionar à Descoberta Baseada em Literatura