Diferenciação populacional em genes sob forte seleção balanceadora:um estudo de caso com genes HLA.

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Brandt, Débora Yoshihara Caldeira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
HLA
Link de acesso: http://www.teses.usp.br/teses/disponiveis/41/41131/tde-25092015-104711/
Resumo: Seleção balanceadora é definida como aquela que aumenta a variabilidade genética de populações em relação ao esperado sob neutralidade. Uma expectativa sobre seus efeitos é a redução da diferenciação populacional nos genes onde atua. Contudo, regimes que mantêm conjuntos distintos de alelos em diferentes populações poderiam resultar em aumento de diferenciação populacional. Com o objetivo de compreender melhor os efeitos da seleção balanceadora sobre a distribuição da variação genética entre populações, investigamos a diferenciação populacional em genes dos Antígenos Leucocitários Humanos (HLA, do inglês, Human Leukocyte Antigen), que são os genes mais polimórficos do genoma humano e o exemplo mais clássico de seleção balanceadora em humanos. As proteínas HLA são responsáveis pela apresentação de peptídeos aos linfócitos T, mediando uma etapa crítica da resposta imune. A vantagem da manutenção de variação nesses genes está possivelmente associada à capacidade de resposta a uma maior diversidade de patógenos. Neste estudo, analisamos dados do projeto 1000 Genomas (1000G), que sequenciou indivíduos de diferentes populações usando sequenciamento de nova geração (NGS, do inglês, Next Generation Sequencing). Essa técnica de sequenciamento é conhecidamente problemática quando aplicada a regiões altamente polimórficas, como os genes HLA. Por isso, avaliamos a confiabilidade dos genótipos e frequências alélicas estimados a partir dos dados do 1000G nos genes HLA, utilizando como padrão ouro dados de sequenciamento Sanger de 930 das 1092 amostras do 1000G. Encontramos um viés de superestimativa da frequência do alelo referência em alguns polimorfismos de nucleotídeo único (SNPs, do inglês, Single Nucleotide Polimorphisms), indicando que viés de mapeamento é uma causa importante de erros nos dados do 1000G. Esses resultados são relevantes para a compreensão dos desafios do uso de dados de NGS em outras regiões de alta diversidade. Usando os resultados dessa análise, excluímos de nosso estudo de diferenciação populacional sítios com estimativas de frequências alélicas pouco confiáveis nos dados do 1000G. Em uma segunda etapa de controle metodológico, demonstramos o efeito do uso de dados ricos em variantes raras em estudos de diferenciação populacional. Controlando para esse efeito, e usando apenas sítios que demonstramos ser confiáveis em nossos dados, descobrimos que a diferenciação populacional de SNPs nos genes HLA é menor que a diferenciação de SNPs em outras regiões do genoma. Esse resultado aponta para um papel predominante de pressões seletivas globais na distribuição da variação genética de HLA entre populações. Contudo, apresentamos também evidências de que a diferenciação populacional de haplótipos nos genes HLA pode ser maior do que a observada no nível dos SNPs, sugerindo que pressões locais podem influenciar a distribuição de haplótipos entre populações. Nossos achados indicam que é possível reconciliar baixa diferenciação populacional em SNPs com maior diferenciação em haplótipos, possivelmente sujeitos a pressões seletivas locais.