Detalhes bibliográficos
Ano de defesa: |
2019 |
Autor(a) principal: |
Santiago, Caio Rafael do Nascimento |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/95/95131/tde-02032020-102628/
|
Resumo: |
As pesquisas no campo da genômica produzem uma grande quantidade de dados. Entretanto, o conhecimento genético acerca de certos fenótipos é limitado. Além disso, parte considerável dos genomas estudados possuem sequências codificantes (CDSs) com funções desconhecidas, representando um desafio adicional para a compreensão dos pesquisadores. Organismos provenientes de um mesmo ramo evolutivo compartilham muitas de suas CDSs, e certos fenótipos únicos a um grupo desses indivíduos podem ser resultado de um conjunto único de genes exclusivos. Neste trabalho é apresentado o arcabouço computacional GTACG, uma ferramenta com foco em uma usabilidade facilitada e destinada a pesquisas para identificação de características genéticas únicas em subgrupos de genomas de bactérias que possuem um determinado fenótipo em comum, encontrando dados que diferenciam eles dos outros organismos de forma simples. A análise do GTACG é baseada na formação de grupos de CDSs homólogas com base em alinhamentos locais. O front-end é simples de usar e a instalação de pacotes foi projetada para que usuários com pouco conhecimento em computação possam fazer análises complexas usando esta ferramenta. A validação dos resultados do GTACG se baseou em dois estudos de caso envolvendo um conjunto com 161 genomas da família Xanthomonadaceae e 45 genomas de Streptococcus pyogenes. No primeiro estudo de caso, buscava-se descobrir porque algumas Xanthomonadaceae se associam a plantas e outras não, e de fato foram encontradas 19 famílias de proteínas ortólogas exclusivas aos genomas associados a plantas (representando mais de 90% desses genomas), permitindo a identificação de proteínas potencialmente associadas com a adaptação e a virulência dessas bactérias nos tecidos das plantas. No segundo estudo, buscou-se encontrar marcadores filogenéticos para a proteína emm dos Streptococcus pyogenes, e foram encontrados 15 famílias de proteínas ortólogas que serviriam para este papel. Além disso, também foram encontrados algumas famílias combinadas que poderiam explicar parte das doenças causadas pelo Streptococcus pyogenes em seres humanos. Os resultados mostram o potencial de uso do GTACG para encontrar novos objetos de pesquisa para estudos moleculares de genômica comparativa de bactérias. |