Ferramenta e análise de BIG data aplicadas a leishmaniose tegumentar: aspectos clínicos e genômicos

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Torres, Felipe Guimarães
Orientador(a): Khouri, Ricardo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/50142
Resumo: metodológicos e de custos reduzidos a geração de dados biológicos sobre os parasitos responsáveis pelas Leishmanioses em especial a Leishmania braziliensis. O genoma desse parasito foi sequenciado e reanotado e os estudos clínicos têm avançado com técnicas mais assertivas de tratamento e diagnóstico. Estudos genéticos, correlacionaram mutações em sítios genômicos específicos desse parasito com uma manifestação clínica atípica permitindo o maior entendimento do impacto de alterações do genoma do parasito na patologia do hospedeiro. Todavia, existe uma carência de novas ferramentas computacionais que permitam o armazenamento e integração desses múltiplos tipos de dados estruturados e não-estruturados, gerados pelas pesquisas e novas tecnologias utilizadas. As novas técnicas e recursos computacionais permitem que essa integração de dados componha análises mais complexas utilizando um maior volume dos mesmos. Assim propõe-se desenvolver bancos de dados com as caraterísticas clínico-epidemiológicas dos pacientes e as variações do parasito. OBJETIVO: Realizar uma análise exploratória do genoma da Leishmania braziliensis e desenvolver ferramentas para sua interação com dados clínicos. MATERIAL E MÉTODO: Inicialmente, foi realizado um estudo na área endêmica de Jiquiriçá/BA para levantamento de requisitos e especificações para um sistema que se adequasse ao gerenciamento de dados clínicos em estudos de Coorte desse patógeno. O sistema foi desenvolvido em Java com seu banco de dados utilizando o Postgres. Depois dessa fase, analisou-se todos os genomas disponíveis no estudo ERP003732 do SRA (Sequence Read Archive), totalizando 98 amostras sequenciadas de L. braziliensis. Um pipeline computacional foi utilizado para análise de mutações sendo composto por: Trimmomatic, GATK, SAMTools e BEDTools. Em seguida, avaliou-se a variação gênica utilizando a medida de entropia sendo construída uma árvore filogenética utilizando o Mega X. RESULTADOS E CONCLUSÕES: Utilizando a experiência de pesquisadores especialistas em estudos clínicos de Leishmaniose Tegumentar (LT), foi desenvolvido um gerenciador de dados clínicos e imagens de estudos sobre essa patologia, o RegaDB Leishmaniasis. Este se integra com as principais ferramentas de análises de dados clínicos por meio da exportação de dados em arquivos CSV (Comma separated values). O acesso aos dados se dá através do controle de acesso realizado por contas de usuários e níveis. Todo o código-fonte dessa ferramenta é open-source e está disponível no Github (https://github.com/fgtorres/regadbleishmaniasis). Nesse trabalho, foi realizado o estudo da variedade de nucleotídeos ao longo do genoma da L. braziliensis. Identificou-se cerca de 25.368 sítios com mutações no dataset de genomas. Estes foram anotados, sendo que 32% (8.311 de 25.368) das mutações ocorreram em regiões intra-gênicas. Alguns desses genes possuíam mais de 10 sítios com ocorrência de mutações ao longo da sua sequência como por exemplo Kinetoplast-associated protein-like, que demonstrou um grande potencial para identificação de subgênero. Com a possibilidade de armazenamento de dados e imagens, o RegaDB Leishmaniasis permite a criação de banco de dados de múltiplos tipos que pode ser utilizado em análises complexas por técnicas de Big Data dando suporte a novos estudos.