Detalhes bibliográficos
Ano de defesa: |
2022 |
Autor(a) principal: |
Araujo, Nicolas da Matta Freire |
Orientador(a): |
Mesquita, Rafael Dias |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Link de acesso: |
https://www.arca.fiocruz.br/handle/icict/55145
|
Resumo: |
A doença de Chagas é uma doença tropical negligenciada que somente possui tratamento paliativo, logo, deve ser contida por medidas de urbanização e controle vetorial. O protozoário Trypanosoma cruzi, causador da doença, é transmitido por triatomíneos dos gêneros Triatoma, Panstrongylus e Rhodnius. O Rhodnius prolixus é um importante vetor na América Latina, sendo o primeiro triatomíneo a ter seu genoma sequenciado e analisado por um grupo internacional. Entretanto, a versão de montagem do seu genoma mais atual (Hi-C) não possui predição gênica, além de que existem genes preditos exclusivamente em versões anteriores. A técnica Hi-C permite utilizar o mapeamento físico da cromatina para guiar a montagem gerando um genoma de maior qualidade. Logo, se faz necessário uma nova predição gênica na montagem Hi-C juntamente com a conciliação com as predições anteriores, além da disponibilização desses dados em um navegador, para visualização e exploração pela comunidade científica. Portanto, foi feita a predição gênica (P13) da versão mais atual de montagem do genoma utilizando o software AUGUSTUS, que acabou identificando 15.181 transcritos codificadores de proteínas e, alcançou uma completude de 92,7%, sendo a maior dentre as predições de R. prolixus consideradas. Em seguida, os genes antigos passaram por filtros para a remoção de sequências com bases indefinidas, redundância e quimeras, totalizando 13.840 genes codificadores de proteína e 1.505 não-codificadores de proteínas. Os não codificadores foram alinhados contra o genoma Hi-C utilizando tanto o programa Sim4 quanto o Exonerate, destes, apenas 345 genes alinharam em regiões sem predição gênica. Já os codificadores foram utilizados para enriquecer a predição P13 através de um script desenvolvido para fazer a conciliação tanto de genes preditos como de genes de transcriptoma. A conciliação com genes de transcriptoma e com genes preditos antigos resultou na predição P15 com 17.500 proteínas com completude de 93,2% sendo a predição de maior qualidade para R. prolixus. A P15 juntamente com as montagens de genoma, as predições antigas e dados de RNAseq foram disponibilizados no navegador de genomas JBrowse, hospedado em um servidor do Laboratório de Bioinformática do Instituto de Química da UFRJ. Dessa maneira, a disponibilização de todos esses dados navegáveis, poderá fomentar os estudos biológicos e de controle vetorial com o inseto. Além de possibilitar estudos comparativos com espécies de triatomíneos que venham a ocupar seu nicho biológico. Por fim, o script aqui desenvolvido também pode ser usado para a conciliação de genes de outras espécies |