Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter

Almeida, Fernanda Nascimento

Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter

Bibliographic Details
Main Author:	Almeida, Fernanda Nascimento
Publication Date:	2007
Format:	Master thesis
Language:	por
Source:	Biblioteca Digital de Teses e Dissertações do LNCC
Download full:	https://tede.lncc.br/handle/tede/55
Summary:	Esta dissertação resultou na implementação de uma abordagem computacional para a análise comparativa entre informações de genomas completamente seqüenciados de bactérias associadas à planta. O sistema desenvolvido foi denominado de Probacter e é composto de um banco de dados relacional e de ferramentas computacionais para a análise de seqüências, teve por finalidade agrupar as informações disponíveis em vários bancos de dados em um único ambiente, oferecer uma padronização às informações disponibilizadas e fornecer ferramentas para análises comparativas e de seqüências. O banco de dados contém informações provenientes de diversas fontes, incluindo as bases GenBank, Swiss-Prot, TrEMBL, Interpro, COG e GO. As proteínas foram organizadas dentro de grupos, utilizando a metodologia de BBH (Bidirectional Best Hit) e a anotação padronizada de acordo com a classificação funcional anteriormente descrita para o Projeto Genoma de bactérias do gênero Xanthomonas. Cada entrada disponibilizada pelo sistema numa interface amigável corresponde a uma ficha contendo informações sobre o gene e a proteína por ele codificada, incluindo a categorização funcional, a predição de domínios, a seqüência de aminoácidos da proteína, a ligação com os grupos gerados pelo BBH, referências direta a outros bancos de dados, e as publicações científicas. O sistema oferece uma interface de busca comum a bancos de dados, utilizando consultas pré-definidas. Para consultas mais elaboradas, foi desenvolvida uma interface para ser utilizada sem que o usuário tenha conhecimento prévio de linguagens como SQL e/ou da arquitetura desta base. Ferramentas de alinhamento múltiplo ClustalW e T-Coffee e o programa BLASTP também foram integradas a este sistema, permitindo que sejam feitas comparações entre seqüências internas e externas ao banco. O ProBacter integra ferramentas de visualização gráfica, que permite disponibilizar o posicionamento dos genes pertencentes a grupos no genoma de cada organismo e que permite visualizar as ligações durante a formação dos grupos formados pelo BBH. Por fim, um campo aberto é disponibilizado para que seja possível a intervenção de usuários na anotação de novas informações em determinada entrada, sendo as informações novas oferecidas gravadas diretamente no banco de dados.

Item metadata

id	LNCC_179ef31e52aead9bd387b55f971b0a5c
oai_identifier_str	oai:tede-server.lncc.br:tede/55
network_acronym_str	LNCC
network_name_str	Biblioteca Digital de Teses e Dissertações do LNCC
repository_id_str
spelling	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacterImplementation of a plant-associated bacteria proteome database:ProBacterGenômica ComparativaBioinformáticaProteomasBiologia computacionalBase de dados ProBactergenomicsProteomicsBioinformaticsDatabase ProBacterComputational biologyCNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAOEsta dissertação resultou na implementação de uma abordagem computacional para a análise comparativa entre informações de genomas completamente seqüenciados de bactérias associadas à planta. O sistema desenvolvido foi denominado de Probacter e é composto de um banco de dados relacional e de ferramentas computacionais para a análise de seqüências, teve por finalidade agrupar as informações disponíveis em vários bancos de dados em um único ambiente, oferecer uma padronização às informações disponibilizadas e fornecer ferramentas para análises comparativas e de seqüências. O banco de dados contém informações provenientes de diversas fontes, incluindo as bases GenBank, Swiss-Prot, TrEMBL, Interpro, COG e GO. As proteínas foram organizadas dentro de grupos, utilizando a metodologia de BBH (Bidirectional Best Hit) e a anotação padronizada de acordo com a classificação funcional anteriormente descrita para o Projeto Genoma de bactérias do gênero Xanthomonas. Cada entrada disponibilizada pelo sistema numa interface amigável corresponde a uma ficha contendo informações sobre o gene e a proteína por ele codificada, incluindo a categorização funcional, a predição de domínios, a seqüência de aminoácidos da proteína, a ligação com os grupos gerados pelo BBH, referências direta a outros bancos de dados, e as publicações científicas. O sistema oferece uma interface de busca comum a bancos de dados, utilizando consultas pré-definidas. Para consultas mais elaboradas, foi desenvolvida uma interface para ser utilizada sem que o usuário tenha conhecimento prévio de linguagens como SQL e/ou da arquitetura desta base. Ferramentas de alinhamento múltiplo ClustalW e T-Coffee e o programa BLASTP também foram integradas a este sistema, permitindo que sejam feitas comparações entre seqüências internas e externas ao banco. O ProBacter integra ferramentas de visualização gráfica, que permite disponibilizar o posicionamento dos genes pertencentes a grupos no genoma de cada organismo e que permite visualizar as ligações durante a formação dos grupos formados pelo BBH. Por fim, um campo aberto é disponibilizado para que seja possível a intervenção de usuários na anotação de novas informações em determinada entrada, sendo as informações novas oferecidas gravadas diretamente no banco de dados.This dissertation offers a computation approach to comparative analysis between cmpletely sequenced genomes of plant-associated bacteria. The created system was denominated ProBacter and it is composed of a relational database and computational tools for sequence analysis. The database was created from a diverse data source, including information from GenBank, TrEMBL, Interpro, COG and GO. The proteins were organized into clusters through the BBH (Bidirectional Best Hits) methodology and categorized according to the functional classification of the Xanthomonas Genome Project. Each entry displayed by the system in a friendly user interface corresponds to an information sheet with the gene and protein sequence, functional category, domain prediction, and related scientific publications, in addition to the group that it belongs, and external links. The system offers a search interface similar to other database systems with pre-formatted queries. For advanced queries, the user has access to an interface that can be used without previous knowledge of the SQL language or ProBacter s database arquiteture. The BLASTP program and two multiple sequence alignment tools, namely ClustalW and T-Coffee, were integrated into the system as well, allowing internal and external sequence comparison. In addition, the system makes available visualization tools capable of displaying the gene position inside a genome and BHH links of clusters. Also, the user is capable of adding new information for each gene in the system. ProBacter s goal is to collect information available from a large source of databases into one computational environment, organize this information and offer comparative tools for sequence analysis.Coordenacao de Aperfeicoamento de Pessoal de Nivel SuperiorLaboratório Nacional de Computação CientíficaServiço de Análise e Apoio a Formação de Recursos HumanosBRLNCCPrograma de Pós-Graduação em Modelagem ComputacionalMonteiro-vitorello, Claudia de BarrosCPF:57425230925http://lattes.cnpq.br/6714385683554087Vasconcelos, Ana Tereza RibeiroCPF:81737963787http://lattes.cnpq.br/8989199088323836Thompson, Fabiano LopesCPF:77140389004http://lattes.cnpq.br/4148145822928884Sluys, Marie-anne Vanhttp://lattes.cnpq.br/5131787064674647Almeida, Fernanda Nascimento2015-03-04T18:50:46Z2007-06-192007-03-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfALMEIDA, Fernanda Nascimento. Implementation of a plant-associated bacteria proteome database:ProBacter. 2007. 102 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2007.https://tede.lncc.br/handle/tede/55porinfo:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações do LNCCinstname:Laboratório Nacional de Computação Científica (LNCC)instacron:LNCC2018-07-04T12:59:32Zoai:tede-server.lncc.br:tede/55Biblioteca Digital de Teses e Dissertaçõeshttps://tede.lncc.br/PUBhttps://tede.lncc.br/oai/requestlibrary@lncc.br\|\|library@lncc.bropendoar:2018-07-04T12:59:32Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)false
dc.title.none.fl_str_mv	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter Implementation of a plant-associated bacteria proteome database:ProBacter
title	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter
spellingShingle	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter Almeida, Fernanda Nascimento Genômica Comparativa Bioinformática Proteomas Biologia computacional Base de dados ProBacter genomics Proteomics Bioinformatics Database ProBacter Computational biology CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
title_short	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter
title_full	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter
title_fullStr	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter
title_full_unstemmed	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter
title_sort	Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter
author	Almeida, Fernanda Nascimento
author_facet	Almeida, Fernanda Nascimento
author_role	author
dc.contributor.none.fl_str_mv	Monteiro-vitorello, Claudia de Barros CPF:57425230925 http://lattes.cnpq.br/6714385683554087 Vasconcelos, Ana Tereza Ribeiro CPF:81737963787 http://lattes.cnpq.br/8989199088323836 Thompson, Fabiano Lopes CPF:77140389004 http://lattes.cnpq.br/4148145822928884 Sluys, Marie-anne Van http://lattes.cnpq.br/5131787064674647
dc.contributor.author.fl_str_mv	Almeida, Fernanda Nascimento
dc.subject.por.fl_str_mv	Genômica Comparativa Bioinformática Proteomas Biologia computacional Base de dados ProBacter genomics Proteomics Bioinformatics Database ProBacter Computational biology CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
topic	Genômica Comparativa Bioinformática Proteomas Biologia computacional Base de dados ProBacter genomics Proteomics Bioinformatics Database ProBacter Computational biology CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::TEORIA DA COMPUTACAO::COMPUTABILIDADE E MODELOS DE COMPUTACAO
description	Esta dissertação resultou na implementação de uma abordagem computacional para a análise comparativa entre informações de genomas completamente seqüenciados de bactérias associadas à planta. O sistema desenvolvido foi denominado de Probacter e é composto de um banco de dados relacional e de ferramentas computacionais para a análise de seqüências, teve por finalidade agrupar as informações disponíveis em vários bancos de dados em um único ambiente, oferecer uma padronização às informações disponibilizadas e fornecer ferramentas para análises comparativas e de seqüências. O banco de dados contém informações provenientes de diversas fontes, incluindo as bases GenBank, Swiss-Prot, TrEMBL, Interpro, COG e GO. As proteínas foram organizadas dentro de grupos, utilizando a metodologia de BBH (Bidirectional Best Hit) e a anotação padronizada de acordo com a classificação funcional anteriormente descrita para o Projeto Genoma de bactérias do gênero Xanthomonas. Cada entrada disponibilizada pelo sistema numa interface amigável corresponde a uma ficha contendo informações sobre o gene e a proteína por ele codificada, incluindo a categorização funcional, a predição de domínios, a seqüência de aminoácidos da proteína, a ligação com os grupos gerados pelo BBH, referências direta a outros bancos de dados, e as publicações científicas. O sistema oferece uma interface de busca comum a bancos de dados, utilizando consultas pré-definidas. Para consultas mais elaboradas, foi desenvolvida uma interface para ser utilizada sem que o usuário tenha conhecimento prévio de linguagens como SQL e/ou da arquitetura desta base. Ferramentas de alinhamento múltiplo ClustalW e T-Coffee e o programa BLASTP também foram integradas a este sistema, permitindo que sejam feitas comparações entre seqüências internas e externas ao banco. O ProBacter integra ferramentas de visualização gráfica, que permite disponibilizar o posicionamento dos genes pertencentes a grupos no genoma de cada organismo e que permite visualizar as ligações durante a formação dos grupos formados pelo BBH. Por fim, um campo aberto é disponibilizado para que seja possível a intervenção de usuários na anotação de novas informações em determinada entrada, sendo as informações novas oferecidas gravadas diretamente no banco de dados.
publishDate	2007
dc.date.none.fl_str_mv	2007-06-19 2007-03-26 2015-03-04T18:50:46Z
dc.type.status.fl_str_mv	info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv	info:eu-repo/semantics/masterThesis
format	masterThesis
status_str	publishedVersion
dc.identifier.uri.fl_str_mv	ALMEIDA, Fernanda Nascimento. Implementation of a plant-associated bacteria proteome database:ProBacter. 2007. 102 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2007. https://tede.lncc.br/handle/tede/55
identifier_str_mv	ALMEIDA, Fernanda Nascimento. Implementation of a plant-associated bacteria proteome database:ProBacter. 2007. 102 f. Dissertação (Mestrado em Modelagem computacional) - Laboratório Nacional de Computação Científica, Petrópolis, 2007.
url	https://tede.lncc.br/handle/tede/55
dc.language.iso.fl_str_mv	por
language	por
dc.rights.driver.fl_str_mv	info:eu-repo/semantics/openAccess
eu_rights_str_mv	openAccess
dc.format.none.fl_str_mv	application/pdf
dc.publisher.none.fl_str_mv	Laboratório Nacional de Computação Científica Serviço de Análise e Apoio a Formação de Recursos Humanos BR LNCC Programa de Pós-Graduação em Modelagem Computacional
publisher.none.fl_str_mv	Laboratório Nacional de Computação Científica Serviço de Análise e Apoio a Formação de Recursos Humanos BR LNCC Programa de Pós-Graduação em Modelagem Computacional
dc.source.none.fl_str_mv	reponame:Biblioteca Digital de Teses e Dissertações do LNCC instname:Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC
instname_str	Laboratório Nacional de Computação Científica (LNCC)
instacron_str	LNCC
institution	LNCC
reponame_str	Biblioteca Digital de Teses e Dissertações do LNCC
collection	Biblioteca Digital de Teses e Dissertações do LNCC
repository.name.fl_str_mv	Biblioteca Digital de Teses e Dissertações do LNCC - Laboratório Nacional de Computação Científica (LNCC)
repository.mail.fl_str_mv	library@lncc.br\|\|library@lncc.br
_version_	1832737878502801408

Implementação de um banco de dados de proteomas de bactérias associadas a plantas: ProBacter

Similar Items