Desenvolvimento de estratégias para o uso de mapa de contatos em problemas de predição de novo de estruturas de proteínas
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA) Brasil LNCC Programa de Pós-Graduação em Modelagem Computacional |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://tede.lncc.br/handle/tede/355 |
Resumo: | A predição de estrutura de proteínas (PSP) é um dos desafios mais importantes da biologia molecular computacional e possui como objetivo determinar a estrutura tridimensional de proteínas a partir de suas sequências de aminoácidos. A cada dois anos, desde 1994, o estado da arte da predição de estrutura de proteínas é avaliado em um dos mais importantes eventos na área, o CASP (The Critical Assessment of Protein Structure Prediction). Em suas últimas edições (CASP 10, 11 e 12), o uso de mapas de contatos de proteínas em problemas de PSP mostrou ser uma estratégia promissora para obtenção de modelos de proteínas cada vez mais precisos. O objetivo científico desse trabalho está associado com a análise das informações extraídas de mapas de contatos de proteínas e o desenvolvimento de estratégias para PSP utilizando essas informações. Nesse contexto, foi desenvolvido e implementado na função de aptidão do algoritmo genético do programa GAPF (do inglês Genetic Algorithm for Protein Folding) um novo potencial que trata os contatos resíduo- resíduo presentes no mapa sob a forma de restrições de distância. Para avaliar o potencial desenvolvido foram usados (i) mapas de contatos nativos, isto é, extraídos diretamente da estrutura tridimensional determinada para a proteína alvo, e (ii) mapas de contatos preditos pelos programas de predição de contatos MetaPSICOV e RaptorX-Contact. O Potencial de Contatos foi inicialmente testado em um conjunto de seis proteínas e as análises dos resultados indicam que seu uso promove importantes melhorias na qualidade estrutural dos modelos preditos pelo programa GAPF. Por exemplo, o uso de tais restrições permitiu a redução de 7,32Å no valor de RMSD (com relação à estrutura determinada experimentalmente) e aumento de 35,28% no valor de GDT-TS (métricas comumente usadas para avaliação dos modelos gerados) para o melhor modelo predito para a proteína T0820-D1 em comparação ao melhor resultado obtido usando a função de aptidão padrão do GAPF. A expansão do conjunto teste e a comparação com métodos consolidados na literatura, como o Quark e o Rosetta, mostraram que o GAPF, usando as estratégias de contatos propostas nesse trabalho, é um bom candidato para predições de novo de estruturas de proteínas. Dessa forma, confirma-se que o uso de mapas de contatos, sob a forma de restrições de distância, é uma estratégia útil e eficiente para metodologias que utilizam abordagens de novo de PSP. |