Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas

Detalhes bibliográficos
Autor(a) principal: Catanho, Marcos
Data de Publicação: 2010
Tipo de documento: Tese
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
Texto Completo: https://arca.fiocruz.br/handle/icict/69681
Resumo: Esta tese trata de abordagens computacionais para a análise comparativa de genomas em larga escala e da análise da variabilidade em funções enzimáticas de procariotos. Este trabalho apresenta um banco de dados denominado ProteinWorldDB, que representa um esforço importante para criar um conjunto de dados consistente e confiável de comparações entre o conteúdo protéico codificado por centenas de genomas completamente seqüenciados, usando uma abordagem rigorosa baseada em programação dinâmica. Além disto, este trabalho descreve uma metodologia aprimorada para detecção e anotação de pseudogenes em procariotos (e outros organismos com organização genômica similar), e uma análise da ocorrência, distribuição e padrões de extinção de enzimas análogas preditas em procariotos. A base de dados ProteinWorldDB oferece à comunidade científica a oportunidade de minerar dados comparativos calculados de forma precisa e usar a informação disponível – e.g. índices de similaridade (e suas estimativas estatísticas) entre pares ou grupos de proteínas, proteínas ortólogas e parálogas inferidas, genes taxonomicamente restritos (únicos), entre outras – como ponto de partida para análises subseqüentes. Nossa metodologia para a detecção e anotação de pseudogenes em procariotos, baseada em comparações entre seqüências codificantes e regiões intergênicas de genomas-alvos, apresenta duas inovações importantes: a reconstrução da seqüência remanescente a partir de todos os fragmentos encontrados, não somente a partir do mais similar e a determinação de limiares de similaridade adequados ao conjunto de dados analisado, com base em validações estatísticas. A aplicação deste método na busca de pseudogenes na via glicolítica/gliconeogênese de centenas de procariotos resultou em um número expressivo de novos pseudogenes identificados, mostrando a necessidade de se incluir mecanismos de busca sistemática de pseudogenes nos fluxos de anotação genômica de procariotos. A análise da ocorrência, distribuição e padrões de extinção de enzimas análogas preditas na via glicolítica/gliconeogênese de centenas de procariotos nos revelou um quadro complexo, difícil de ser interpretado, mesmo quando apenas um pequeno grupo de espécies selecionadas foi utilizado. Um estudo mais detalhado, relacionando os resultados obtidos ao estilo de vida, filogenia, estrutura e organização genômicas destas espécies, será necessária para tentar responder às questões fundamentais que nos colocamos: como surgem as enzimas análogas e, sobretudo, por que, aparentemente, ocorreram tantos eventos de origem independente de atividades enzimáticas durante a evolução, e por que existem diferentes formas análogas coexistindo no mesmo organismo? A manutenção de duas ou mais formas análogas poderia proporcionar flexibilidade metabólica e, portanto, uma vantagem seletiva, dependendo do ambiente e estilo de vida do organismo; ou, ainda, distintas formas poderiam competir pela execução de uma mesma função e, neste caso, sendo uma das formas mais competitiva que a outra, a desfuncionalização da forma menos competitiva poderia representar uma vantagem seletiva, já que o gasto energético com a biossíntese da enzima seria eliminado. Seria possível considerar enzimas análogas como indivíduos e seus grupos como populações, todos em competição por um nicho metabólico em particular? Neste caso, seria plausível imaginar que enzimas mais competitivas teriam uma vantagem seletiva sobre formas alternativas menos competitivas e, conseqüentemente, dispersar-se-iam entre os diversos genomas bacterianos, com o passar do tempo.
id CRUZ_de131c331fd0fae768d3fb6529faea8f
oai_identifier_str oai:arca.fiocruz.br:icict/69681
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Catanho, MarcosVicente, Ana Carolina PauloSilva Jr, Floriano PaesSchrago, Carlos Eduardo GuerraMota, Fabio Faria daFerreira, Marcelo AlvesMiranda, Antonio Basílio deDegrave, Wim Maurits2025-04-15T20:30:45Z2025-04-15T20:30:45Z2010CATANHO, Marcos. Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas. 2010. 184 f. Tese (Doutorado em Biologia Celular e Molecular) — Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2010.https://arca.fiocruz.br/handle/icict/69681Esta tese trata de abordagens computacionais para a análise comparativa de genomas em larga escala e da análise da variabilidade em funções enzimáticas de procariotos. Este trabalho apresenta um banco de dados denominado ProteinWorldDB, que representa um esforço importante para criar um conjunto de dados consistente e confiável de comparações entre o conteúdo protéico codificado por centenas de genomas completamente seqüenciados, usando uma abordagem rigorosa baseada em programação dinâmica. Além disto, este trabalho descreve uma metodologia aprimorada para detecção e anotação de pseudogenes em procariotos (e outros organismos com organização genômica similar), e uma análise da ocorrência, distribuição e padrões de extinção de enzimas análogas preditas em procariotos. A base de dados ProteinWorldDB oferece à comunidade científica a oportunidade de minerar dados comparativos calculados de forma precisa e usar a informação disponível – e.g. índices de similaridade (e suas estimativas estatísticas) entre pares ou grupos de proteínas, proteínas ortólogas e parálogas inferidas, genes taxonomicamente restritos (únicos), entre outras – como ponto de partida para análises subseqüentes. Nossa metodologia para a detecção e anotação de pseudogenes em procariotos, baseada em comparações entre seqüências codificantes e regiões intergênicas de genomas-alvos, apresenta duas inovações importantes: a reconstrução da seqüência remanescente a partir de todos os fragmentos encontrados, não somente a partir do mais similar e a determinação de limiares de similaridade adequados ao conjunto de dados analisado, com base em validações estatísticas. A aplicação deste método na busca de pseudogenes na via glicolítica/gliconeogênese de centenas de procariotos resultou em um número expressivo de novos pseudogenes identificados, mostrando a necessidade de se incluir mecanismos de busca sistemática de pseudogenes nos fluxos de anotação genômica de procariotos. A análise da ocorrência, distribuição e padrões de extinção de enzimas análogas preditas na via glicolítica/gliconeogênese de centenas de procariotos nos revelou um quadro complexo, difícil de ser interpretado, mesmo quando apenas um pequeno grupo de espécies selecionadas foi utilizado. Um estudo mais detalhado, relacionando os resultados obtidos ao estilo de vida, filogenia, estrutura e organização genômicas destas espécies, será necessária para tentar responder às questões fundamentais que nos colocamos: como surgem as enzimas análogas e, sobretudo, por que, aparentemente, ocorreram tantos eventos de origem independente de atividades enzimáticas durante a evolução, e por que existem diferentes formas análogas coexistindo no mesmo organismo? A manutenção de duas ou mais formas análogas poderia proporcionar flexibilidade metabólica e, portanto, uma vantagem seletiva, dependendo do ambiente e estilo de vida do organismo; ou, ainda, distintas formas poderiam competir pela execução de uma mesma função e, neste caso, sendo uma das formas mais competitiva que a outra, a desfuncionalização da forma menos competitiva poderia representar uma vantagem seletiva, já que o gasto energético com a biossíntese da enzima seria eliminado. Seria possível considerar enzimas análogas como indivíduos e seus grupos como populações, todos em competição por um nicho metabólico em particular? Neste caso, seria plausível imaginar que enzimas mais competitivas teriam uma vantagem seletiva sobre formas alternativas menos competitivas e, conseqüentemente, dispersar-se-iam entre os diversos genomas bacterianos, com o passar do tempo.This thesis deals with computational approaches for large-scale comparative analysis of genomes and with the investigation of the variability in enzymatic functions in prokaryotes. This work presents a database denominated ProteinWorldDB, which represents a major effort to create a reliable and consistent dataset of crosscomparisons of the whole protein content encoded in hundreds of completely sequenced genomes using a rigorous dynamic programming approach. It also describes an improved method to detect and annotate pseudogenes in prokaryotes, which can also be applied to other microorganisms with similar genomic organization, and an analysis of the frequency, distribution and extinction patterns of predicted analogous enzymes in prokaryotes. The ProteinWorldDB provides the scientific community the opportunity to mine accurately calculated comparative data and provides the use of this information – e.g. similarity scores (and statistical estimates) between pairs or groups of protein sequences, inferred orthologous and paralogous proteins, taxonomically restricted (unique) genes, among others – as a starting point for subsequent analysis. Our method to detect and annotate pseudogenes in prokaryotes, based on comparisons involving coding sequences and intergenic regions of target genomes, presents two relevant innovations: the reconstruction of the remnant sequence using the whole set of similar sequence fragments, instead of using only the most similar one, and the establishment of similarity thresholds adjusted to the particular dataset analyzed, based on statistical evaluations. The application of this method to the glycolysis/gluconeogenesis pathway of hundreds of prokaryotes resulted in a number of newly identified pseudogenes, evidencing the necessity to include systematic approaches to pseudogene detection/annotation in prokaryotic genome annotation pipelines. Analysis of the frequency, distribution and extinction patterns of predicted analogous enzymes in the glycolysis/gluconeogenesis pathway of hundreds of prokaryotes has revealed an intricate pattern, difficult to interpret, even if only a small group of selected species is considered. An in depth analysis, taking lifestyle, phylogeny, genomic structure and organization of the species involved into account, will be necessary to answer the critical questions we have posed to ourselves: how analogous enzymes arise and, above all, why so many events of independent origin of enzymatic functions have apparently occurred during evolution, and why are there distinct analogous forms coexisting in the same organism? Keeping two or more analogous forms could provide metabolic flexibility and therefore selective advantage, considering the organism's environment and lifestyle, or yet distinct forms could compete to perform the same function, and in such a case, if one of them were more competitive than the other, the disfunctionalization of the less competitive form could present a selective advantage, since the energy expense to synthesize it would be abolished. One might also consider analogous enzymes as individuals and their clusters as populations, all in competition for a particular metabolic niche? In such a case, it would be plausible to think that more competitive enzymes could have a selective advantage over less competitive alternative forms, and could consequently spread over diverse bacterial genomes over time.Programa de Desenvolvimento Tecnológico em Insumos para Saúde (PDTIS), através da Plataforma de Bioinformática – RJ (RPT04A). Fundação de Amparo à Pesquisa do Estado do Rio de Janeiro (FAPERJ), através do Programa Auxílio à Pesquisa Básica (APQ1), 2006. Título do projeto: Análise Comparativa de Genomas Procarióticos. Red Iberoamericana de Bioinformática (RIB), através do Concurso Estadias de Investigacion, 2006. Título do projeto: Ecologia genômica: genes competindo por um nicho metabólico. IBM® e World Community GridTM, através de seu sistema de computação em rede, em escala mundial. Título do projeto: Genome Comparison: Improving protein functional annotation in databases, 2006. Programa AMSUD-PASTEUR, através do Programa de Intercambio Científico, 2007. Título do projeto: Ecologia genômica: genes competindo por um nicho metabólico. Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES), através do Programa de Intercâmbio Científico CAPES-UdelaR, 2008. Título do projeto: Análise Comparativa de Genomas Procarióticos. Programa Estratégico de Apoio à Pesquisa em Saúde (PAPES), através do Programa PAPES-V, 2008. Título do projeto: Ecologia genômica: genes competindo por um nicho metabólico.Fundação Oswaldo Cruz. Instituto Oswaldo Cruz. Programa de Pós-Graduação em Biologia Celular e Molecular. Rio de Janeiro, RJ, Brasil.porFiocruz/IOCGenômicaBases de Dados de Ácidos NucleicosSequenciamento de Nucleotídeos em Larga EscalaPseudogenesBactériasArchaeaEnzimasGenomicsDatabases, Nucleic AcidHigh-Throughput Nucleotide SequencingPseudogenesBacteriaArchaeaEnzymesGenômicaBases de Dados de Ácidos NucleicosSequenciamento de Nucleotídeos em Larga EscalaPseudogenesBactériasArchaeaEnzimasGenômica comparativa de procariotos: análise da variabilidade em funções enzimáticasComparative genomics of prokaryotes: analysis of variability in enzymatic functionsinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesis2010-06-22Instituto Oswaldo CruzFundação Oswaldo CruzRio de Janeiro/RJPrograma de Pós-Graduação em Biologia Celular e Molecularinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txtlicense.txttext/plain; charset=utf-82991https://arca.fiocruz.br/bitstreams/0d1e09f4-5379-485a-8d14-7a4acb0cfd82/download5a560609d32a3863062d77ff32785d58MD51falseAnonymousREADMarcos Catanho - Termo de Cessão de Direitos Autorais.pdfMarcos Catanho - Termo de Cessão de Direitos Autorais.pdfTermo de Cessão de Direitos Autoraisapplication/pdf526992https://arca.fiocruz.br/bitstreams/2176a28f-85ff-48f4-854f-1e2542ee0920/download90618461ac3695e280bc07250f74c214MD55falseBloqueadoREAD9999-12-31ORIGINALCatanho_Tese_2010.pdfCatanho_Tese_2010.pdfTese autoarquivada pelo autorapplication/pdf11364595https://arca.fiocruz.br/bitstreams/3cd26c07-7631-4648-8364-008c6fed57e2/download221a71dfb6c67d89019a7ed3501e0c9cMD53trueAnonymousREADmarcos_catanho_ioc_dout_2010.pdfmarcos_catanho_ioc_dout_2010.pdfTese disponível no Catálogo Mouriscoapplication/pdf264661842https://arca.fiocruz.br/bitstreams/e476001f-d06e-4f82-a9d9-09b58754e0da/download288228c33cb48026f0c37c7582c28d62MD54falseAnonymousREADTEXTCatanho_Tese_2010.pdf.txtCatanho_Tese_2010.pdf.txtExtracted texttext/plain103171https://arca.fiocruz.br/bitstreams/0e674152-cca6-4a10-86b6-2d7bc83c3b6e/downloadd45e3e92bdbc102c1793a95c282a3216MD510falseAnonymousREADmarcos_catanho_ioc_dout_2010.pdf.txtmarcos_catanho_ioc_dout_2010.pdf.txtExtracted texttext/plain103174https://arca.fiocruz.br/bitstreams/7189dfd1-b1b5-426c-ae3b-203951c7aa7d/download3eaca8bb34bc743b8e8deb2637da8a0eMD512falseAnonymousREADTHUMBNAILCatanho_Tese_2010.pdf.jpgCatanho_Tese_2010.pdf.jpgGenerated Thumbnailimage/jpeg3160https://arca.fiocruz.br/bitstreams/82f43a9c-e811-48db-8926-a740f80b30c1/download6faf1177d413a6f54446750ed0197ba8MD511falseAnonymousREADmarcos_catanho_ioc_dout_2010.pdf.jpgmarcos_catanho_ioc_dout_2010.pdf.jpgGenerated Thumbnailimage/jpeg3163https://arca.fiocruz.br/bitstreams/8a4d60b7-c237-4e6c-a805-77b50b5abf33/download1ce9935f46690c48ed80af0eaf013b35MD513falseAnonymousREADicict/696812025-07-29 22:49:03.614open.accessoai:arca.fiocruz.br:icict/69681https://arca.fiocruz.brRepositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352025-07-30T01:49:03Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)falseQ0VTU8ODTyBOw4NPIEVYQ0xVU0lWQSBERSBESVJFSVRPUyBBVVRPUkFJUwoKQW8gYWNlaXRhciBvcyBURVJNT1MgZSBDT05EScOHw5VFUyBkZXN0YSBDRVNTw4NPLCBvIEFVVE9SIGUvb3UgVElUVUxBUiBkZSBkaXJlaXRvcwphdXRvcmFpcyBzb2JyZSBhIE9CUkEgZGUgcXVlIHRyYXRhIGVzdGUgZG9jdW1lbnRvOgoKKDEpIENFREUgZSBUUkFOU0ZFUkUsIHRvdGFsIGUgZ3JhdHVpdGFtZW50ZSwgw6AgRklPQ1JVWiAtIEZVTkRBw4fDg08gT1NXQUxETyBDUlVaLCBlbQpjYXLDoXRlciBwZXJtYW5lbnRlLCBpcnJldm9nw6F2ZWwgZSBOw4NPIEVYQ0xVU0lWTywgdG9kb3Mgb3MgZGlyZWl0b3MgcGF0cmltb25pYWlzIE7Dg08KQ09NRVJDSUFJUyBkZSB1dGlsaXphw6fDo28gZGEgT0JSQSBhcnTDrXN0aWNhIGUvb3UgY2llbnTDrWZpY2EgaW5kaWNhZGEgYWNpbWEsIGluY2x1c2l2ZSBvcyBkaXJlaXRvcwpkZSB2b3ogZSBpbWFnZW0gdmluY3VsYWRvcyDDoCBPQlJBLCBkdXJhbnRlIHRvZG8gbyBwcmF6byBkZSBkdXJhw6fDo28gZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCBlbQpxdWFscXVlciBpZGlvbWEgZSBlbSB0b2RvcyBvcyBwYcOtc2VzOwoKKDIpIEFDRUlUQSBxdWUgYSBjZXNzw6NvIHRvdGFsIG7Do28gZXhjbHVzaXZhLCBwZXJtYW5lbnRlIGUgaXJyZXZvZ8OhdmVsIGRvcyBkaXJlaXRvcyBhdXRvcmFpcwpwYXRyaW1vbmlhaXMgbsOjbyBjb21lcmNpYWlzIGRlIHV0aWxpemHDp8OjbyBkZSBxdWUgdHJhdGEgZXN0ZSBkb2N1bWVudG8gaW5jbHVpLCBleGVtcGxpZmljYXRpdmFtZW50ZSwKb3MgZGlyZWl0b3MgZGUgZGlzcG9uaWJpbGl6YcOnw6NvIGUgY29tdW5pY2HDp8OjbyBww7pibGljYSBkYSBPQlJBLCBlbSBxdWFscXVlciBtZWlvIG91IHZlw61jdWxvLAppbmNsdXNpdmUgZW0gUmVwb3NpdMOzcmlvcyBEaWdpdGFpcywgYmVtIGNvbW8gb3MgZGlyZWl0b3MgZGUgcmVwcm9kdcOnw6NvLCBleGliacOnw6NvLCBleGVjdcOnw6NvLApkZWNsYW1hw6fDo28sIHJlY2l0YcOnw6NvLCBleHBvc2nDp8OjbywgYXJxdWl2YW1lbnRvLCBpbmNsdXPDo28gZW0gYmFuY28gZGUgZGFkb3MsIHByZXNlcnZhw6fDo28sIGRpZnVzw6NvLApkaXN0cmlidWnDp8OjbywgZGl2dWxnYcOnw6NvLCBlbXByw6lzdGltbywgdHJhZHXDp8OjbywgZHVibGFnZW0sIGxlZ2VuZGFnZW0sIGluY2x1c8OjbyBlbSBub3ZhcyBvYnJhcyBvdQpjb2xldMOibmVhcywgcmV1dGlsaXphw6fDo28sIGVkacOnw6NvLCBwcm9kdcOnw6NvIGRlIG1hdGVyaWFsIGRpZMOhdGljbyBlIGN1cnNvcyBvdSBxdWFscXVlciBmb3JtYSBkZQp1dGlsaXphw6fDo28gbsOjbyBjb21lcmNpYWw7CgooMykgUkVDT05IRUNFIHF1ZSBhIGNlc3PDo28gYXF1aSBlc3BlY2lmaWNhZGEgY29uY2VkZSDDoCBGSU9DUlVaIC0gRlVOREHDh8ODTyBPU1dBTERPCkNSVVogbyBkaXJlaXRvIGRlIGF1dG9yaXphciBxdWFscXVlciBwZXNzb2Eg4oCTIGbDrXNpY2Egb3UganVyw61kaWNhLCBww7pibGljYSBvdSBwcml2YWRhLCBuYWNpb25hbCBvdQplc3RyYW5nZWlyYSDigJMgYSBhY2Vzc2FyIGUgdXRpbGl6YXIgYW1wbGFtZW50ZSBhIE9CUkEsIHNlbSBleGNsdXNpdmlkYWRlLCBwYXJhIHF1YWlzcXVlcgpmaW5hbGlkYWRlcyBuw6NvIGNvbWVyY2lhaXM7CgooNCkgREVDTEFSQSBxdWUgYSBvYnJhIMOpIGNyaWHDp8OjbyBvcmlnaW5hbCBlIHF1ZSDDqSBvIHRpdHVsYXIgZG9zIGRpcmVpdG9zIGFxdWkgY2VkaWRvcyBlIGF1dG9yaXphZG9zLApyZXNwb25zYWJpbGl6YW5kby1zZSBpbnRlZ3JhbG1lbnRlIHBlbG8gY29udGXDumRvIGUgb3V0cm9zIGVsZW1lbnRvcyBxdWUgZmF6ZW0gcGFydGUgZGEgT0JSQSwKaW5jbHVzaXZlIG9zIGRpcmVpdG9zIGRlIHZveiBlIGltYWdlbSB2aW5jdWxhZG9zIMOgIE9CUkEsIG9icmlnYW5kby1zZSBhIGluZGVuaXphciB0ZXJjZWlyb3MgcG9yCmRhbm9zLCBiZW0gY29tbyBpbmRlbml6YXIgZSByZXNzYXJjaXIgYSBGSU9DUlVaIC0gRlVOREHDh8ODTyBPU1dBTERPIENSVVogZGUKZXZlbnR1YWlzIGRlc3Blc2FzIHF1ZSB2aWVyZW0gYSBzdXBvcnRhciwgZW0gcmF6w6NvIGRlIHF1YWxxdWVyIG9mZW5zYSBhIGRpcmVpdG9zIGF1dG9yYWlzIG91CmRpcmVpdG9zIGRlIHZveiBvdSBpbWFnZW0sIHByaW5jaXBhbG1lbnRlIG5vIHF1ZSBkaXogcmVzcGVpdG8gYSBwbMOhZ2lvIGUgdmlvbGHDp8O1ZXMgZGUgZGlyZWl0b3M7CgooNSkgQUZJUk1BIHF1ZSBjb25oZWNlIGEgUG9sw610aWNhIEluc3RpdHVjaW9uYWwgZGUgQWNlc3NvIEFiZXJ0byBkYSBGSU9DUlVaIC0gRlVOREHDh8ODTwpPU1dBTERPIENSVVogZSBhcyBkaXJldHJpemVzIHBhcmEgbyBmdW5jaW9uYW1lbnRvIGRvIHJlcG9zaXTDs3JpbyBpbnN0aXR1Y2lvbmFsIEFSQ0EuCgpBIFBvbMOtdGljYSBJbnN0aXR1Y2lvbmFsIGRlIEFjZXNzbyBBYmVydG8gZGEgRklPQ1JVWiAtIEZVTkRBw4fDg08gT1NXQUxETyBDUlVaIHJlc2VydmEKZXhjbHVzaXZhbWVudGUgYW8gQVVUT1Igb3MgZGlyZWl0b3MgbW9yYWlzIGUgb3MgdXNvcyBjb21lcmNpYWlzIHNvYnJlIGFzIG9icmFzIGRlIHN1YSBhdXRvcmlhCmUvb3UgdGl0dWxhcmlkYWRlLCBzZW5kbyBvcyB0ZXJjZWlyb3MgdXN1w6FyaW9zIHJlc3BvbnPDoXZlaXMgcGVsYSBhdHJpYnVpw6fDo28gZGUgYXV0b3JpYSBlIG1hbnV0ZW7Dp8OjbwpkYSBpbnRlZ3JpZGFkZSBkYSBPQlJBIGVtIHF1YWxxdWVyIHV0aWxpemHDp8Ojby4KCkEgUG9sw610aWNhIEluc3RpdHVjaW9uYWwgZGUgQWNlc3NvIEFiZXJ0byBkYSBGSU9DUlVaIC0gRlVOREHDh8ODTyBPU1dBTERPIENSVVoKcmVzcGVpdGEgb3MgY29udHJhdG9zIGUgYWNvcmRvcyBwcmVleGlzdGVudGVzIGRvcyBBdXRvcmVzIGNvbSB0ZXJjZWlyb3MsIGNhYmVuZG8gYW9zIEF1dG9yZXMKaW5mb3JtYXIgw6AgSW5zdGl0dWnDp8OjbyBhcyBjb25kacOnw7VlcyBlIG91dHJhcyByZXN0cmnDp8O1ZXMgaW1wb3N0YXMgcG9yIGVzdGVzIGluc3RydW1lbnRvcy4K
dc.title.none.fl_str_mv Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
dc.title.alternative.none.fl_str_mv Comparative genomics of prokaryotes: analysis of variability in enzymatic functions
title Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
spellingShingle Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
Catanho, Marcos
Genômica
Bases de Dados de Ácidos Nucleicos
Sequenciamento de Nucleotídeos em Larga Escala
Pseudogenes
Bactérias
Archaea
Enzimas
Genomics
Databases, Nucleic Acid
High-Throughput Nucleotide Sequencing
Pseudogenes
Bacteria
Archaea
Enzymes
Genômica
Bases de Dados de Ácidos Nucleicos
Sequenciamento de Nucleotídeos em Larga Escala
Pseudogenes
Bactérias
Archaea
Enzimas
title_short Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
title_full Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
title_fullStr Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
title_full_unstemmed Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
title_sort Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas
author Catanho, Marcos
author_facet Catanho, Marcos
author_role author
dc.contributor.member.none.fl_str_mv Vicente, Ana Carolina Paulo
Silva Jr, Floriano Paes
Schrago, Carlos Eduardo Guerra
Mota, Fabio Faria da
Ferreira, Marcelo Alves
dc.contributor.author.fl_str_mv Catanho, Marcos
dc.contributor.advisor1.fl_str_mv Miranda, Antonio Basílio de
Degrave, Wim Maurits
contributor_str_mv Miranda, Antonio Basílio de
Degrave, Wim Maurits
dc.subject.other.none.fl_str_mv Genômica
Bases de Dados de Ácidos Nucleicos
Sequenciamento de Nucleotídeos em Larga Escala
Pseudogenes
Bactérias
Archaea
Enzimas
topic Genômica
Bases de Dados de Ácidos Nucleicos
Sequenciamento de Nucleotídeos em Larga Escala
Pseudogenes
Bactérias
Archaea
Enzimas
Genomics
Databases, Nucleic Acid
High-Throughput Nucleotide Sequencing
Pseudogenes
Bacteria
Archaea
Enzymes
Genômica
Bases de Dados de Ácidos Nucleicos
Sequenciamento de Nucleotídeos em Larga Escala
Pseudogenes
Bactérias
Archaea
Enzimas
dc.subject.en.none.fl_str_mv Genomics
Databases, Nucleic Acid
High-Throughput Nucleotide Sequencing
Pseudogenes
Bacteria
Archaea
Enzymes
dc.subject.decs.none.fl_str_mv Genômica
Bases de Dados de Ácidos Nucleicos
Sequenciamento de Nucleotídeos em Larga Escala
Pseudogenes
Bactérias
Archaea
Enzimas
description Esta tese trata de abordagens computacionais para a análise comparativa de genomas em larga escala e da análise da variabilidade em funções enzimáticas de procariotos. Este trabalho apresenta um banco de dados denominado ProteinWorldDB, que representa um esforço importante para criar um conjunto de dados consistente e confiável de comparações entre o conteúdo protéico codificado por centenas de genomas completamente seqüenciados, usando uma abordagem rigorosa baseada em programação dinâmica. Além disto, este trabalho descreve uma metodologia aprimorada para detecção e anotação de pseudogenes em procariotos (e outros organismos com organização genômica similar), e uma análise da ocorrência, distribuição e padrões de extinção de enzimas análogas preditas em procariotos. A base de dados ProteinWorldDB oferece à comunidade científica a oportunidade de minerar dados comparativos calculados de forma precisa e usar a informação disponível – e.g. índices de similaridade (e suas estimativas estatísticas) entre pares ou grupos de proteínas, proteínas ortólogas e parálogas inferidas, genes taxonomicamente restritos (únicos), entre outras – como ponto de partida para análises subseqüentes. Nossa metodologia para a detecção e anotação de pseudogenes em procariotos, baseada em comparações entre seqüências codificantes e regiões intergênicas de genomas-alvos, apresenta duas inovações importantes: a reconstrução da seqüência remanescente a partir de todos os fragmentos encontrados, não somente a partir do mais similar e a determinação de limiares de similaridade adequados ao conjunto de dados analisado, com base em validações estatísticas. A aplicação deste método na busca de pseudogenes na via glicolítica/gliconeogênese de centenas de procariotos resultou em um número expressivo de novos pseudogenes identificados, mostrando a necessidade de se incluir mecanismos de busca sistemática de pseudogenes nos fluxos de anotação genômica de procariotos. A análise da ocorrência, distribuição e padrões de extinção de enzimas análogas preditas na via glicolítica/gliconeogênese de centenas de procariotos nos revelou um quadro complexo, difícil de ser interpretado, mesmo quando apenas um pequeno grupo de espécies selecionadas foi utilizado. Um estudo mais detalhado, relacionando os resultados obtidos ao estilo de vida, filogenia, estrutura e organização genômicas destas espécies, será necessária para tentar responder às questões fundamentais que nos colocamos: como surgem as enzimas análogas e, sobretudo, por que, aparentemente, ocorreram tantos eventos de origem independente de atividades enzimáticas durante a evolução, e por que existem diferentes formas análogas coexistindo no mesmo organismo? A manutenção de duas ou mais formas análogas poderia proporcionar flexibilidade metabólica e, portanto, uma vantagem seletiva, dependendo do ambiente e estilo de vida do organismo; ou, ainda, distintas formas poderiam competir pela execução de uma mesma função e, neste caso, sendo uma das formas mais competitiva que a outra, a desfuncionalização da forma menos competitiva poderia representar uma vantagem seletiva, já que o gasto energético com a biossíntese da enzima seria eliminado. Seria possível considerar enzimas análogas como indivíduos e seus grupos como populações, todos em competição por um nicho metabólico em particular? Neste caso, seria plausível imaginar que enzimas mais competitivas teriam uma vantagem seletiva sobre formas alternativas menos competitivas e, conseqüentemente, dispersar-se-iam entre os diversos genomas bacterianos, com o passar do tempo.
publishDate 2010
dc.date.issued.fl_str_mv 2010
dc.date.accessioned.fl_str_mv 2025-04-15T20:30:45Z
dc.date.available.fl_str_mv 2025-04-15T20:30:45Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv CATANHO, Marcos. Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas. 2010. 184 f. Tese (Doutorado em Biologia Celular e Molecular) — Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2010.
dc.identifier.uri.fl_str_mv https://arca.fiocruz.br/handle/icict/69681
identifier_str_mv CATANHO, Marcos. Genômica comparativa de procariotos: análise da variabilidade em funções enzimáticas. 2010. 184 f. Tese (Doutorado em Biologia Celular e Molecular) — Instituto Oswaldo Cruz, Fundação Oswaldo Cruz, Rio de Janeiro, 2010.
url https://arca.fiocruz.br/handle/icict/69681
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Fiocruz/IOC
publisher.none.fl_str_mv Fiocruz/IOC
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://arca.fiocruz.br/bitstreams/0d1e09f4-5379-485a-8d14-7a4acb0cfd82/download
https://arca.fiocruz.br/bitstreams/2176a28f-85ff-48f4-854f-1e2542ee0920/download
https://arca.fiocruz.br/bitstreams/3cd26c07-7631-4648-8364-008c6fed57e2/download
https://arca.fiocruz.br/bitstreams/e476001f-d06e-4f82-a9d9-09b58754e0da/download
https://arca.fiocruz.br/bitstreams/0e674152-cca6-4a10-86b6-2d7bc83c3b6e/download
https://arca.fiocruz.br/bitstreams/7189dfd1-b1b5-426c-ae3b-203951c7aa7d/download
https://arca.fiocruz.br/bitstreams/82f43a9c-e811-48db-8926-a740f80b30c1/download
https://arca.fiocruz.br/bitstreams/8a4d60b7-c237-4e6c-a805-77b50b5abf33/download
bitstream.checksum.fl_str_mv 5a560609d32a3863062d77ff32785d58
90618461ac3695e280bc07250f74c214
221a71dfb6c67d89019a7ed3501e0c9c
288228c33cb48026f0c37c7582c28d62
d45e3e92bdbc102c1793a95c282a3216
3eaca8bb34bc743b8e8deb2637da8a0e
6faf1177d413a6f54446750ed0197ba8
1ce9935f46690c48ed80af0eaf013b35
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1839716158419238912