Desenvolvimento de estratégias para o uso de mapa de contatos em problemas de predição de novo de estruturas de proteínas

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Santos, Karina Baptista dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Laboratório Nacional de Computação Científica
Coordenação de Pós-Graduação e Aperfeiçoamento (COPGA)
Brasil
LNCC
Programa de Pós-Graduação em Modelagem Computacional
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.lncc.br/handle/tede/355
Resumo: A predição de estrutura de proteínas (PSP) é um dos desafios mais importantes da biologia molecular computacional e possui como objetivo determinar a estrutura tridimensional de proteínas a partir de suas sequências de aminoácidos. A cada dois anos, desde 1994, o estado da arte da predição de estrutura de proteínas é avaliado em um dos mais importantes eventos na área, o CASP (The Critical Assessment of Protein Structure Prediction). Em suas últimas edições (CASP 10, 11 e 12), o uso de mapas de contatos de proteínas em problemas de PSP mostrou ser uma estratégia promissora para obtenção de modelos de proteínas cada vez mais precisos. O objetivo científico desse trabalho está associado com a análise das informações extraídas de mapas de contatos de proteínas e o desenvolvimento de estratégias para PSP utilizando essas informações. Nesse contexto, foi desenvolvido e implementado na função de aptidão do algoritmo genético do programa GAPF (do inglês Genetic Algorithm for Protein Folding) um novo potencial que trata os contatos resíduo- resíduo presentes no mapa sob a forma de restrições de distância. Para avaliar o potencial desenvolvido foram usados (i) mapas de contatos nativos, isto é, extraídos diretamente da estrutura tridimensional determinada para a proteína alvo, e (ii) mapas de contatos preditos pelos programas de predição de contatos MetaPSICOV e RaptorX-Contact. O Potencial de Contatos foi inicialmente testado em um conjunto de seis proteínas e as análises dos resultados indicam que seu uso promove importantes melhorias na qualidade estrutural dos modelos preditos pelo programa GAPF. Por exemplo, o uso de tais restrições permitiu a redução de 7,32Å no valor de RMSD (com relação à estrutura determinada experimentalmente) e aumento de 35,28% no valor de GDT-TS (métricas comumente usadas para avaliação dos modelos gerados) para o melhor modelo predito para a proteína T0820-D1 em comparação ao melhor resultado obtido usando a função de aptidão padrão do GAPF. A expansão do conjunto teste e a comparação com métodos consolidados na literatura, como o Quark e o Rosetta, mostraram que o GAPF, usando as estratégias de contatos propostas nesse trabalho, é um bom candidato para predições de novo de estruturas de proteínas. Dessa forma, confirma-se que o uso de mapas de contatos, sob a forma de restrições de distância, é uma estratégia útil e eficiente para metodologias que utilizam abordagens de novo de PSP.