Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas

Bibliographic Details
Main Author: Oliveira, Lariza Laura de
Publication Date: 2011
Format: Master thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da USP
Download full: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/
Summary: Proteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG.
id USP_6bfb95a3d9a726a1f8b27eb8e2804f2b
oai_identifier_str oai:teses.usp.br:tde-26012012-161321
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínasKnowledge-based Approach to Genetic Algorithms for the Protein Structure Prediction ProblemAlgoritmos GenéticosCoarse-Grained ModelGenetic AlgorithmsModelo Coarse-GrainedPredição de Estruturas de ProteínasProtein Structure PreditionProteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG.Proteins exhibit an enormous variety of biology functions. The knowledge of tertiary structures can help the understanding of the proteins function. According to Anfisen, the native tertiary structure of a protein can be determined by its primary structure information, what could allow that computational methods could be used to predict the tertiary structure when the primary structure is available. However, there is still not a computational tool to solve the structure prediction problem for a large range of proteins. In this way, Protein Structure Prediction (PSP) has been a challenge to Molecular Biology. The conformation of native protein is usually the thermodynamically most stable configuration, i.e., the one having the lowest free energy. Hence, PSP can be viewed as a problem of optimization, where the structure with the lowest free energy should be found among all possible structures. However, this is an NP-problem, where traditional optimization methods, in general, do not have good performance. Genetic algorithms (GAs), due to their characteristics, are interesting for this class of problems. In recent years, there is a growing interest in using GAs for the protein structure prediction problem. The main objective of this work is to verify the addition of useful information to GAs employed in PSP. Each individual of the GA represents a solution for the optimization problem which is, in this case, a possible conformation that will be evaluated by a force field function. Thus, an individual is encoded by a set of torsion angles of each amino acid. In order to reduce the search space, a database composed of angles, determined by crystallography and NMR, is used. With the aim to guide the final search process and maintain diversity in GAs, two strategies were employed here: Random Immigrants and Similarity-based Immigrants. The last strategy was based on similarity of primary amino acid sequence. Furthermore, in this work, a coarse-grained force field, which uses -carbon to represent the protein backbone was employed to evaluate the individuals of GA.Biblioteca Digitais de Teses e Dissertações da USPTinós, RenatoOliveira, Lariza Laura de2011-05-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:10:30Zoai:teses.usp.br:tde-26012012-161321Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212016-07-28T16:10:30Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
Knowledge-based Approach to Genetic Algorithms for the Protein Structure Prediction Problem
title Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
spellingShingle Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
Oliveira, Lariza Laura de
Algoritmos Genéticos
Coarse-Grained Model
Genetic Algorithms
Modelo Coarse-Grained
Predição de Estruturas de Proteínas
Protein Structure Predition
title_short Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_full Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_fullStr Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_full_unstemmed Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_sort Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
author Oliveira, Lariza Laura de
author_facet Oliveira, Lariza Laura de
author_role author
dc.contributor.none.fl_str_mv Tinós, Renato
dc.contributor.author.fl_str_mv Oliveira, Lariza Laura de
dc.subject.por.fl_str_mv Algoritmos Genéticos
Coarse-Grained Model
Genetic Algorithms
Modelo Coarse-Grained
Predição de Estruturas de Proteínas
Protein Structure Predition
topic Algoritmos Genéticos
Coarse-Grained Model
Genetic Algorithms
Modelo Coarse-Grained
Predição de Estruturas de Proteínas
Protein Structure Predition
description Proteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG.
publishDate 2011
dc.date.none.fl_str_mv 2011-05-20
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/
url http://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1826319025435574272