Integração de dados de expressão gênica e proteômica em redes de interação proteína-proteína de Trypanosoma cruzi

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Guimarães, Frederico Gonçalves
Orientador(a): Ruiz, Jeronimo Conceição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/19538
Resumo: Paradoxalmente vivemos um momento da pesquisa científica em que possuímos um volume abundante de dados, mas com dificuldades cada vez maiores de se obter informações a partir deles. Diversidade de formatos, dificuldade na construção de uma forma de acesso simples, mas não superficial, ausência de um identificador único para as unidades biológicas de estudo (proteínas, RNAs, genes, etc.) e falta de integração entre os bancos de dados são alguns dos desafios enfrentados cotidianamente na tarefa de mineração de informações a partir dessas diversas fontes. Com o objetivo de contribuir na tarefa de extração de informações a partir de fontes públicas, mediante a integração de dados de enriquecimento funcional, construímos uma metodologia de trabalho que permite a obtenção, filtragem e tratamento de dados oriundos do banco STRING v.10 e de análises massivas de RNA e proteínas, integrando-os em redes de interação proteína-proteína através do software Cytoscape . Como organismo modelo, trabalhamos com dois clones de Trypanosoma cruzi , apresentando diferenças relacionadas aos perfis de infectividade (alta e baixa infectividade). Utilizamos dados de genes diferencialmente expressos identificados em experimentos de RNA-Seq e shotgun proteomics . Durante o estudo foram construídos 11 scripts e 3 programas, parte integrante de uma metodologia modular aplicável a outros organismos e modelos experimentais, tanto em sua totalidade quando parcialmente. Como resultado, além da metodologia, obtivemos também o resultado de sua implementação, que consistiu de uma série de redes de interação proteína-proteína do organismo estudado, onde foram destacadas características de interesse biológico, tais como informações de EC number, agrupamentos funcionais, tipo de interação entre as proteínas e importância das proteínas segundo métricas de teoria de grafos. Concluímos, então, que a utilização de redes de interação proteína-proteína pode ser uma ótima estratégia tanto para a realização de novos estudos quanto para a revisão de estudos anteriores, uma vez que podemos extrair novas informações a partir de dados já existentes publicamente. Além disso as redes nos fornecem uma visão sistêmica do organismo, o que pode desvelar novos olhares sobre a sua biologia dos organismos de estudo .