Predição de estruturas de proteínas utilizando restrições de ângulo diedrais
Ano de defesa: | 2014 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Laboratório Nacional de Computação Científica
Serviço de Análise e Apoio a Formação de Recursos Humanos Brasil LNCC Programa de Pós-Graduação em Modelagem Computacional |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://tede.lncc.br/handle/tede/204 |
Resumo: | A predição de estrutura de proteínas é um dos propósitos mais importantes da biologia molecular computacional e possui como objetivo determinar a estrutura tridimensional de proteínas a partir de suas sequências de aminoácidos. Na técnica de predição por primeiros princípios se considera que a sequência de aminoácidos de uma proteína contém toda a informação necessária para que a cadeia adote, em condições fisiológicas, sua conformação tridimensional nativa. Esse tipo de predição se constitui em um problema de otimização extremamente difícil visto que, dependendo das aproximações efetuadas, se lidam com centenas ou milhares de graus de liberdade e com um espaço de busca conformacional muito complexo associado à uma superfície de energia multimodal. Mesmo para uma pequena molécula de proteína, o problema é difícil de ser tratado computacionalmente devido ao alto custo em tempo de execução, além da complexidade associada ao processo de otimização. O objetivo deste trabalho foi o desenvolvimento de operadores genéticos que atuem no processo de otimização do programa GAPF (Genetic Algorithm for Protein Folding – desenvolvido pelo GMSSB/LNCC) através do uso de restrições no espaço de busca de ângulos diedrais associados à cadeia principal da proteína de modo a acelerar o processo de busca do algoritmo e melhorar a capacidade preditiva do programa. Esse trabalho se desenvolveu em seis etapas: I – Construção uma matriz de ângulos diedrais phi e psi a partir do banco de estruturas de proteínas determinadas experimentalmente, com até 20% de identidade; II - Desenvolvimento e introdução de operadores genéticos de mutação RAMA ao programa GAPF tendo em vista o uso da matriz de ângulos diedrais; III - Geração da população inicial empregando informações fornecidas pelas matrizes de ângulos diedrais; IV - Investigação do uso de matrizes de ângulos diedrais geradas a partir de bibliotecas de fragmentos específicas para cada sequência alvo; V - Verificar o desempenho da metodologia ao serem introduzidas informações a respeito da estrutura secundária da sequência alvo e das proteínas do banco de estruturas usado; e VI - Avaliar o efeito das modificações introduzidas no algoritmo em termos de redução do custo computacional e qualidade das estruturas preditas. A utilização dos operadores foi testada na predição de um conjunto de oito proteínas, pertencentes às classes: preferencialmente alpha; alpha+beta; alpha\beta e preferencialmente beta. Os resultados obtidos mostraram que a imposição de restrições angulares associadas à utilização dos ângulos phi e psi mais favoráveis para cada tipo de resíduo, proporcionaram uma redução de até 75\% do número de avaliações de função de energia necessário para se obter um resultado equivalente sem o uso desses operadores. Adicionalmente, foi possível obter predições de estruturas mais acuradas, com uma redução de até 4Å nos valores de RMSD e um acréscimo de aproximadamente 6% nos valores de GDT-TS das maiores proteínas do conjunto teste, isto é, 1BDD e 1GYZ, quando comparados aos valores obtidos com o GAPF padrão para o mesmo número de avaliações. |