Uma nova estatística para a formação de redes decorrelação entre variantes genéticas

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Jaeger, Janaína Pacheco
Orientador(a): Cybis, Gabriela Bettella
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/238522
Resumo: A relação causal entre polimorfismos genéticos e diferentes fenótipos tem fundamental interesse em diversas áreas biológicas. Os Estudos de Associação Genômica Ampla (GWAS) testam milhares de variantes do genoma em busca de marcadores genéticos associados a traços de interesse, auxiliando a compreensão do mapa genótipo-fenótipo para determinada característica. Entretanto, o interesse não está somente na testagem dessas variantes de forma independente, mas também nas interações existentes entre elas. Nesse sentido, metodologias que propõem montagem de redes interligando marcadores correlacionados representam uma estratégia interessante. Climer et al. (2014) propuseram um método que, através do cálculo do Coeficiente de Correlação Personalizado (CCC), calcula correlações entre pares de SNPs para formação de redes alélicas, que são posteriormente testadas entre indivíduos caso e controle em estudos de associação. No entanto, a distribuição de probabilidade e as propriedades estatísticas desse coeficiente não foram estudadas, já que o CCC foi proposto com base em heurísticas e simulações. O presente estudo obteve propriedades estatísticas do CCC sob a hipótese nula de independência entre variantes de diferentes loci bialélicos. Em particular, sua esperança sugeriu forte viés de seleção dependente de frequências alélicas. Com a finalidade de eliminar esse viés, propusemos uma nova estatística de correlação, a Standardized Average Weighted Biallelic Statistic (SAWB), que denotamos por Sij , calculada a partir da mesma matriz de pesos utilizada no CCC. Para a Sij, foi demonstrada a normalidade assintótica e definido um teste estatístico correspondente. As propriedades estatísticas do CCC e da Sij , assim como de suas estatísticas relacionadas, foram comparadas por estudos de simulação. Da mesma forma, para comparar as redes formadas pelos dois métodos, realizamos uma aplicação em um banco de dados para o Transtorno de Déficit de Atenção e Hiperatividade (TDAH). Tanto os estudos de simulação quanto a aplicação demonstraram os efeitos da seleção dependente de frequência do CCC e verificaram que a Sij corrige esse viés. Além disso, a Sij , com distribuição e propriedades teóricas conhecidas, foi capaz de identificar pares de SNPs correlacionados através de um teste estatístico com Erro Tipo I controlado e maior poder do que o teste baseado na estatística CCC. Portanto, a estatística SAWB mostrou ser uma ferramenta com potencial aplicação em GWAS para formação de redes através de correlações entre pares de SNPs bialélicos.