Avaliação da utilização de índices de similaridade genômica global para classificação de espécies patogênicas emergentes do gênero Corynebacterium

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Alves, Daniele Almeida
Orientador(a): Pacheco, Luis Gustavo Carvalho
Banca de defesa: Castro, Thiago Luiz de Paula, Neto, Aristóteles Góes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia
Programa de Pós-Graduação: Programa de Pós-graduação em Biotecnologia
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufba.br/ri/handle/ri/33104
Resumo: Índices de Similaridade Genômica Global têm sido amplamente utilizados nos últimos anos para classificação taxonômica de bactérias. Entre estes, a Identidade Média de Nucleotídeos por BLAST (ANIb) é amplamente considerada como o índice mais preciso para a circunscrição de espécies bacterianas, quando se considera um limite 95-96% de identidade. No entanto, o uso exclusivo de ANIb para esta identificação pode gerar resultados confusos para alguns grupos bacterianos intimamente relacionados, como muitos patógenos de Corynebacterium spp. Nesse trabalho desenvolvemos e avaliamos o desempenho de um classificador de espécies desenvolvido internamente, com base nos valores de correlação entre diferentes índices de parentesco do genoma, para classificar sequências genômicas do grupo Corynebacterium diphtheriae. Para isso, 213 sequências genômicas correspondentes a três espécies de Corynebacterium intimamente relacionadas foram recuperadas do NCBI Genoma DB: 188 classificados como C. diphtheriae e 03 isolados de C. diphtheriae subsp. lausannense; 10 como Corynebacterium belfantii; 01 como Corynebacterium rouxii e 11 classificados como C. diphtheriae obtidos do Arquivo Europeu de Nucleotídeos. Os padrões de uso de tetranucleotídeos (TETRA) e ANIb foram calculados no servidor Web JSpecies através de comparações par-a-par entre os genomas avaliados. As matrizes resultantes foram mescladas para gerar uma matriz com os valores concatenados de ANIb e TETRA para cada bactéria, representando uma forma de impressão digital, que foi então utilizada para calcular os valores de correlação de Spearman entre os genomas através de uma estratégia própria desenvolvido no ambiente estatístico R. Análise de sequência multilocus utilizando os genes: atpA, gyrA, dnaE, dnaK, fusA, leuA e rpoB e análises de decomposição dividida foram usados para confirmar as relações entre as várias espécies. No total, 45.369 comparações genoma a genoma compuseram a matriz de impressão digital das bactérias que foi usada para construir um dendrograma com clados bem definidos (> 95% de confiança de bootstrap). Os grupos contendo C. belfantii e C. rouxii foi claramente distinguido por esta estratégia, em oposição ao uso de ANIb sozinho que não foi capaz de diferenciar as espécies C. diphtheriae subsp. lausannense CHUV2995 e C. belfantii. Adicionalmente, observamos que nossos resultados são corroborados pela MLSA, evidenciando a classificação errada no NCBI. Com os resultados supracitados nós concluímos que o classificador desenvolvido internamente que integra diferentes índices foi a ferramenta mais eficiente para a circunscrição de espécies no grupo C. diphtheriae, quando comparada para ANIb sozinho. Antecipamos que esta nova estratégia pode ser extrapolada para melhorar a identificação baseada no genoma de outros patógenos bacterianos clinicamente importantes.