Testes estatísticos semi paramétricos para discriminação de grafos

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Soares, Gabriela Eleuterio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20230727-113249/
Resumo: Grafos são utilizados para modelar redes em diversos campos cientíticos. Ao longo dos anos, o interesse em modelar redes do mundo real vem crescendo, com aplicações em diferentes áreas, como biologia molecular (redes genéticas regulatórias, redes de interação proteína- proteína), neurociência (rede funcional cerebral)e ciências sociais (redes sociais como facebook, instagram, foursquare). As redes do mundo real não podem ser modeladas por grafos determinístico adequadamente, pois tais grafos não apresentam componente aleatório dese- jável nestas situações. Além disso, algoritmos tradicionais e abordagem clássicas para grafos apresentam dificuldades e limitações que prejudicam tais análises. Com isso, grafos aleatórios são mais indicados para modelar as redes do mundo real e procedimentos estatísticos precisam ser formalizados com o intuito de facilitar a análise de dados destes grafos, como por exemplo: como comparar dois grafos reais? Uma abordagem tradicional seria verificar o isomorfismo entre gráficos, no entanto, tal abordagem apresenta alguns problemas, como, por exemplo, o custo computacional é alto (não existe algoritmo polinomial) e não considera a flutuação intrínseca presente em processos que modelam eventos do mundo real. Portanto, uma solução é considerar que os grafos reais são gerados por por processos probabilísti- cos (modelo de grafo aleatório) e testar se os grafos foram gerados pelo mesmo modelo e conjunto de parâmetros. Neste trabalho revisaremos os modelos de grafos aleatórios e suas aplicações na modelagem de redes do mundo real, bem como a teoria espectral para grafos e diversos resultados, medidas derivadas do seu estudo e trabalhos recentes que utilizam métodos baseados em medidas espectrais para seleção do modelo em conjuntos de grafos. Finalmente, introduzimos abordagens paramétricas para testar a igualdade entre dois ou mais grafos aleatórios desde que sejam grandes o suficiente. Primeiro é proposto uma generalização de teste de razão de verossimilhança (likelihood ratio test - LRT), a seguir o teste t (t student) é generalizado para grafos e finalmente, a análise de variância (ANOVA) é desenvolvida para testar a igualdade de dois ou mais grafos. Os testes desenvolvidos utilizam medidas baseadas no espectro do grafo, como a entropia espectral e a divergência de Kullback-Leibler no estimador dos parâmetros do modelo. Para estimar a variância, é usado um bootstrap paramétrico. O poder do teste é ilustrado com uso de curvas ROC e a i ii utilidade do método é demonstrada através de sua aplicação na comparação de redes reais de interação proteína-proteína em seis espécies.