Desenvolvimento de metodologia de analise para estimativa da diversidade genética populacional do HIV1 através do sequenciamento de nova geração

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Zukurov, Jean Paulo Lopes [UNIFESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de São Paulo (UNIFESP)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://sucupira.capes.gov.br/sucupira/public/consultas/coleta/trabalhoConclusao/viewTrabalhoConclusao.jsf?popup=true&id_trabalho=2374056
http://repositorio.unifesp.br/handle/11600/46200
Resumo: Desenvolvimento de metodologia de analise para estimativa da diversidade genética populacional do HIV-1 através do sequenciamento de nova geração. Uma das características mais marcantes do HIV-1 é a grande diversidade observada entre as cepas que compõem a pandemia de HIV/AIDS. Entretanto, durante sua transmissão, um número extremamente reduzido de partículas é transferido e constituem a infecção no novo hospedeiro, resultando em uma drástica diminuição da diversidade genética da população original. Esse fenômeno é denominado "bottleneck" e confere um risco em potencial para a sobrevivência da população viral infectante. Decorrido o "bottleneck?" a diversidade genética, que fora perdida, deve ser então recuperada para possibilitar a sobrevivência da população viral no novo ambiente. Neste trabalho foi realizado o desenvolvimento do software TAnDen - Tool for Analysis of Diversity in Viral Populations para realização do alinhamento das short-reads geradas pela plataforma SOLiD. Foi desenvolvido um módulo de análise das short-reads alinhadas utilizando inferência bayesiana com uma distribuição Dirichlet para os estados possíveis na comparação do controle com o dado experimental. O tempo de execução do alinhamento para cada condição experimental com, aproximadamente, 2,7E+07 short-reads, foi em torno de 30 horas em média. Durante o processo de alinhamento foram necessários 1,6 GB de memória RAM. Para o controle e as demais sete condições experimentais foram geradas um total de 214.938.239 milhões (2,1E+08) de short-reads, ou seja, aproximadamente, 1/5 de bilhão short-reads. Do número total de short-reads geradas 144.097.035 milhões (1,4E+08) foram alinhadas e processadas em analises posteriores. Foi analisado o regime mutacional durante o bottleneck e após estabilização da sequência viral utilizando o software TAnDen. A análise de distância variacional progressiva tem como finalidade explorar detalhadamente a principal característica dos cultivos virais sucessivos que geraram os dados analisados. Foi utilizado como base o critério de exclusão de 0,02 para os valores de distância variacional. Apenas 1,51% do total conseguiu atingir o critério de exclusão proposto, sendo os sítios considerados polimórficos em relação a condição adjacente anterior. Foi percebida uma tendência de diminuição linear da distância variacional entre o primeiro e último ponto de cultivo viral, sendo que este pode ser correlacionada com a carga viral e a provável extinção da população viral visualizada a partir da condição 04. Com relação a número de substituições por sítio a condição 01 apresentou o maior numero o poderia ser explicado pela rápida recuperação da população viral após a simulação do efeito bottleneck. Em todas as análises a condição 01, sempre apresentou os maiores valores dentre todas as condições em relação a índices relacionados a diversidade viral populacional. A partir da condição 04 a taxa de substituição apresenta uma queda na ordem de grandeza de 10E-03 para 10E-04, sendo que esta permaneceu neste patamar até o último ponto de cultivo viral e provável extinção da população viral.