Detalhes bibliográficos
Ano de defesa: |
2017 |
Autor(a) principal: |
Guimarães, Frederico Gonçalves |
Orientador(a): |
Ruiz, Jeronimo Conceição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Link de acesso: |
https://www.arca.fiocruz.br/handle/icict/19538
|
Resumo: |
Paradoxalmente vivemos um momento da pesquisa científica em que possuímos um volume abundante de dados, mas com dificuldades cada vez maiores de se obter informações a partir deles. Diversidade de formatos, dificuldade na construção de uma forma de acesso simples, mas não superficial, ausência de um identificador único para as unidades biológicas de estudo (proteínas, RNAs, genes, etc.) e falta de integração entre os bancos de dados são alguns dos desafios enfrentados cotidianamente na tarefa de mineração de informações a partir dessas diversas fontes. Com o objetivo de contribuir na tarefa de extração de informações a partir de fontes públicas, mediante a integração de dados de enriquecimento funcional, construímos uma metodologia de trabalho que permite a obtenção, filtragem e tratamento de dados oriundos do banco STRING v.10 e de análises massivas de RNA e proteínas, integrando-os em redes de interação proteína-proteína através do software Cytoscape . Como organismo modelo, trabalhamos com dois clones de Trypanosoma cruzi , apresentando diferenças relacionadas aos perfis de infectividade (alta e baixa infectividade). Utilizamos dados de genes diferencialmente expressos identificados em experimentos de RNA-Seq e shotgun proteomics . Durante o estudo foram construídos 11 scripts e 3 programas, parte integrante de uma metodologia modular aplicável a outros organismos e modelos experimentais, tanto em sua totalidade quando parcialmente. Como resultado, além da metodologia, obtivemos também o resultado de sua implementação, que consistiu de uma série de redes de interação proteína-proteína do organismo estudado, onde foram destacadas características de interesse biológico, tais como informações de EC number, agrupamentos funcionais, tipo de interação entre as proteínas e importância das proteínas segundo métricas de teoria de grafos. Concluímos, então, que a utilização de redes de interação proteína-proteína pode ser uma ótima estratégia tanto para a realização de novos estudos quanto para a revisão de estudos anteriores, uma vez que podemos extrair novas informações a partir de dados já existentes publicamente. Além disso as redes nos fornecem uma visão sistêmica do organismo, o que pode desvelar novos olhares sobre a sua biologia dos organismos de estudo . |