Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas

Oliveira, Lariza Laura de

Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas

Bibliographic Details
Main Author:	Oliveira, Lariza Laura de
Publication Date:	2011
Format:	Master thesis
Language:	por
Source:	Biblioteca Digital de Teses e Dissertações da USP
Download full:	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/
Summary:	Proteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG.

Item metadata

id	USP_6bfb95a3d9a726a1f8b27eb8e2804f2b
oai_identifier_str	oai:teses.usp.br:tde-26012012-161321
network_acronym_str	USP
network_name_str	Biblioteca Digital de Teses e Dissertações da USP
repository_id_str	2721
spelling	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínasKnowledge-based Approach to Genetic Algorithms for the Protein Structure Prediction ProblemAlgoritmos GenéticosCoarse-Grained ModelGenetic AlgorithmsModelo Coarse-GrainedPredição de Estruturas de ProteínasProtein Structure PreditionProteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG.Proteins exhibit an enormous variety of biology functions. The knowledge of tertiary structures can help the understanding of the proteins function. According to Anfisen, the native tertiary structure of a protein can be determined by its primary structure information, what could allow that computational methods could be used to predict the tertiary structure when the primary structure is available. However, there is still not a computational tool to solve the structure prediction problem for a large range of proteins. In this way, Protein Structure Prediction (PSP) has been a challenge to Molecular Biology. The conformation of native protein is usually the thermodynamically most stable configuration, i.e., the one having the lowest free energy. Hence, PSP can be viewed as a problem of optimization, where the structure with the lowest free energy should be found among all possible structures. However, this is an NP-problem, where traditional optimization methods, in general, do not have good performance. Genetic algorithms (GAs), due to their characteristics, are interesting for this class of problems. In recent years, there is a growing interest in using GAs for the protein structure prediction problem. The main objective of this work is to verify the addition of useful information to GAs employed in PSP. Each individual of the GA represents a solution for the optimization problem which is, in this case, a possible conformation that will be evaluated by a force field function. Thus, an individual is encoded by a set of torsion angles of each amino acid. In order to reduce the search space, a database composed of angles, determined by crystallography and NMR, is used. With the aim to guide the final search process and maintain diversity in GAs, two strategies were employed here: Random Immigrants and Similarity-based Immigrants. The last strategy was based on similarity of primary amino acid sequence. Furthermore, in this work, a coarse-grained force field, which uses -carbon to represent the protein backbone was employed to evaluate the individuals of GA.Biblioteca Digitais de Teses e Dissertações da USPTinós, RenatoOliveira, Lariza Laura de2011-05-20info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2016-07-28T16:10:30Zoai:teses.usp.br:tde-26012012-161321Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.bropendoar:27212016-07-28T16:10:30Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas Knowledge-based Approach to Genetic Algorithms for the Protein Structure Prediction Problem
title	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
spellingShingle	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas Oliveira, Lariza Laura de Algoritmos Genéticos Coarse-Grained Model Genetic Algorithms Modelo Coarse-Grained Predição de Estruturas de Proteínas Protein Structure Predition
title_short	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_full	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_fullStr	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_full_unstemmed	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
title_sort	Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas
author	Oliveira, Lariza Laura de
author_facet	Oliveira, Lariza Laura de
author_role	author
dc.contributor.none.fl_str_mv	Tinós, Renato
dc.contributor.author.fl_str_mv	Oliveira, Lariza Laura de
dc.subject.por.fl_str_mv	Algoritmos Genéticos Coarse-Grained Model Genetic Algorithms Modelo Coarse-Grained Predição de Estruturas de Proteínas Protein Structure Predition
topic	Algoritmos Genéticos Coarse-Grained Model Genetic Algorithms Modelo Coarse-Grained Predição de Estruturas de Proteínas Protein Structure Predition
description	Proteínas desempenham uma grande variedade de funções biológicas. O conhecimento da estrutura tridimensional proteica pode ajudar no entendimento da função desempenhada. De acordo com a hipótese de Anfisen, a estrutura terciária nativa de uma proteína pode ser determinada a partir da informação contida na sequência primária, o que permitiria que métodos computacionais poderiam ser usados para predizer estruturas terciárias quando a primária estiver disponível. No entanto, ainda não existe uma ferramenta computacional capaz de predizer a estrutura tridimensional para uma grande variedade de proteínas. Desse modo, o problema de Predição de Estruturas de Proteínas (PEP) permanece como um desafio para a Biologia Molecular. A conformação nativa de uma proteína é frequentemente a configuração termodinamicamente mais estável, ou seja, que possui menor energia livre. Assim, PEP pode ser vista como um problema de otimização, onde a estrutura com menor energia livre deve ser encontrada dentre todas as possíveis. Entretanto, este é um problema NP-completo, no qual métodos tradicionais de otimização, em geral, não apresentam um bom desempenho. Algoritmos Genéticos (AGs), devido às suas características, são interessantes para essa classe de problemas. O principal objetivo desse trabalho é verificar se a adição de informação pode ser útil aos AGs aplicados em PEP, valendo-se dede modelos moleculares simplificados. Cada indivíduo do AG representa uma solução que, neste caso, é uma possível conformação que será avaliada por um campo de força. Dessa forma, o indivíduo é codificado por um conjunto de ângulos de torção de cada aminoácido. Para auxiliar no processo de busca, bases de dados compostas de ângulos determinados por cristalografia e RNM são utilizadas. Com o objetivo de guiar o processo de busca e manter a diversidade nos AGs, duas estratégias são aqui testadas: Imigrantes Aleatórios e Imigrantes por Similaridade. A última delas foi criada baseando-se na similaridade da sequência primária. Além disso, é investigado neste trabalho o uso de um campo de força coarse grained, que utiliza os átomos de carbono- para representar a cadeia proteica, para avaliar os indivíduos do AG.
publishDate	2011
dc.date.none.fl_str_mv	2011-05-20
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/
url	http://www.teses.usp.br/teses/disponiveis/95/95131/tde-26012012-161321/
dc.language.iso.fl_str_mv	por
language	por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv	Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess
rights_invalid_str_mv	Liberar o conteúdo para acesso público.
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv	Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP
instname_str	Universidade de São Paulo (USP)
instacron_str	USP
institution	USP
reponame_str	Biblioteca Digital de Teses e Dissertações da USP
collection	Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv	virginia@if.usp.br\|\| atendimento@aguia.usp.br\|\|virginia@if.usp.br
_version_	1826319025435574272

Uso de estratégias baseadas em conhecimento para algoritmos genéticos aplicados à predição de estruturas tridimensionais de proteínas

Similar Items