Detalhes bibliográficos
Ano de defesa: |
2017 |
Autor(a) principal: |
Perez Urcia, Walter |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113627/
|
Resumo: |
Redes Bayesianas são modelos gráficos amplamente utilizados para automatizar o raciocínio probabilístico em domínios complexos. Uma rede Bayesiana é um grafo direcionado acíclico no qual os nós representam variáveis aleatórias e os arcos representam relações de dependência entre variáveis. Especificar manualmente uma rede Bayesiana sobre um domínio grande e complexo é uma tarefa altamente custosa e propensa a erros. Isto justifica o desenvolvimento de métodos para aprender estruturas de redes Bayesianas a partir de observações. Uma abordagem bem sucedida para aprendizado de redes Bayesianas é especificar uma função de pontuação (score), que associa cada estrutura a um número que representa a adequação do modelo aos dados e ao conhecimento prévio. O aprendizado então consiste em selecionar uma estrutura com alta pontuação. A aprendizagem estrutural baseada em pontuação é uma tarefa computacionalmente custosa (NP-difícil), o que cria a necessidade de desenvolvimento de técnicas aproximadas. Embora existam muitas técnicas com alguma garantia de qualidade (convergência, consistência ou estimativa de erro), elas possuem um custo computacional alto e não são aplicáveis em domínios muito grandes (centenas ou milhares de variáveis). Uma técnica simples e eficaz para a aprendizagem aproximada de estruturas de redes Bayesianas consiste em realizar uma busca local no espaço de ordenações topológicas de variáveis utilizando um espaço restrito de conjuntos de pais. Embora essa abordagem não possua garantias de desempenho, ela é computacionalmente eficiente, e empiricamente superior a outros métodos, especial- mente quando o número de variáveis é grande. Geralmente, a busca local é inicializada com uma ordenação das variáveis gerada uniformemente no espaço de ordenações. Isso pode levar a busca a obter soluções de baixa qualidade e a requerer um número alto de iterações, o que prejudica o desempenho do método. Esse trabalho tem como objetivo estudar e aprimorar as técnicas de aprendizagem de redes Bayesianas em domínios muito grandes. Em particular, pretende-se melhorar a qualidade das soluções encontradas pelo algoritmo de busca por geração de ordenações topológicas, empregando técnicas do estado-da-arte na geração de conjuntos de pais e desenvolvendo heurísticas informadas para geração de ordenações topológicas. A qualidade das soluções encontradas foi avaliada pela pon- tuação. Os resultados mostram que as novas heurísticas de inicialização melhoram as redes obtidas com uma diferencia significativa. |