Desenvolvimento de workflows científicos para a geração e análise de diferentes redes de interatomas

Detalhes bibliográficos
Ano de defesa: 2012
Autor(a) principal: Notari, Daniel Luís
Orientador(a): Bonatto, Diego
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ucs.br/handle/11338/694
Resumo: Workflows científicos são projetados para realizar experimentos in silico com o intuito de processar e analisar uma grande quantidade de dados usando simulação computacional. Os experimentos são organizados como uma sequência de etapas que caracterizam um fluxo de execução, onde em cada etapa utilizam-se diferentes softwares. Estes softwares não possuem um modelo de representação de dados comum. Por isto, quando um workflow científico é construído com o objetivo de integrar e processar dados, cada etapa precisa analisar a estrutura dos dados, processá-los e preparar os mesmos de acordo com a estrutura necessária para a execução da próxima etapa do workflow. Desta maneira, os workflows científicos usam diferentes algoritmos provenientes das áreas da matemática e da ciência da computação, os quais são capazes de processar, armazenar e transformar os dados utilizados em informação útil para diferentes análises de pesquisadores de biologia. Adicionalmente, a biologia de sistemas é uma subárea da bioinformática que ajuda a compreender as interações observadas entre populações de moléculas, células e organismos resultantes do aumento da complexidade biológica. Assim, nesta tese de doutorado, buscou-se desenvolver workflows científicos utilizando-se ferramentas de bioinformática e biologia de sistemas para comparar processos biológicos através da geração de redes de interação proteínaproteína. Para tanto, o programa Dis2PPI foi gerado por meio de um workflow científico que possibilitou integrar os bancos de dados de doenças monogênicas OMIM (Online Mendelian Inheritance in Man) com o programa de metabuscas STRING (Search Tool for the Retrieval of Interacting Genes/Proteins). O objetivo desta integração foi gerar uma rede de interação proteína-proteína associada com doenças de natureza monogênica. Como prova de conceito, o programa Dis2PPI foi utilizado para a obtenção de redes de interação para as síndromes xeroderma pigmentosa e de Cockayne, duas doenças monogênicas raras e cujos fenótipos estão associados com acúmulos de danos de DNA, câncer, progeria e neurodegeneração. Uma vez geradas, estas redes foram avaliadas com o uso ferramentas de biologia de sistemas para análise de ontologia gênica e de centralidade no programa Cytoscape. Da mesma forma, o programa Net2Homology foi gerado através de um desenho de um workflow científico que possibilitasse integrar o resultado de um alinhamento de sequências de proteínas, usando o programa NCBI PSI-BLAST, com o programa de metabuscas STRING. Neste sentido, o programa Net2Homology possibilitou recuperar duas redes de interação proteína-proteína associada a dois organismos diferentes. Este mesmo programa foi utilizado para a obtenção de redes de interação para a doença xeroderma pigmentosa e para a enzima ciclo-oxigenase-1 cruzando as informações dos organismos Homo sapiens e Mus musculus. As redes de interação obtidas foram comparadas visando obter os processos biológicos evolutivamente conservados.