Seleção de microhaplótipos em larga escala para inferência de ancestralidade na população brasileira

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Rodrigues, Maria Luisa de Barros
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/17/17135/tde-13052024-144922/
Resumo: Os microhaplótipos (MHs) são blocos de 2 ou mais SNPs presentes em um segmento de DNA de tamanho entre 200 e 300 pb. O interesse crescente no uso de MHs é devido à presença de alelos múltiplos, que resulta em maior informatividade que os SNPs individualmente, e menor taxa de mutação que os STRs. Portanto, MHs tornam as estimativas da genética de populações, forense e clínica mais precisas. Visando estimar a ancestralidade da população brasileira pela primeira vez a partir de MHs, elaboramos um pipeline e desenvolvemos um script para seleção de MHs altamente informativos em larga escala, a partir de dados genômicos. Partimos de um dataset incluindo 522 indivíduos do Sudeste do Brasil, mesclados aos dados dos bancos públicos (SGDP, HGDP e 1000 Genome Project), totalizando 4081 indivíduos genotipados em quase 1 milhão de SNPs a partir dos quais selecionamos um conjunto de mais de 120 mil MHs, amplamente distribuídos entre os 22 cromossomos autossômicos. Os marcadores, tanto MHs quanto SNPs, tiveram sua informatividade estimada e foram separados em subconjuntos de marcadores mais informativos para serem utilizados nas estimativas de ancestralidade. Os resultados foram comparados entre si e às estimativas referentes ao conjunto completo de marcadores demonstrando maior eficiência dos MHs para essa finalidade e maior proximidade de resultados dos subconjuntos de MHs em relação ao conjunto completo. Desenvolvemos também uma abordagem para estimar o que chamamos de informatividade cluster específica, no caso informatividade nativa americana, demonstrando maior acurácia na estimativa da proporção de ancestralidade desse grupo sub-representado em bancos de dados públicos.