Export Ready — 

Classification and structure-based inference of transcriptional regulatory proteins

Bibliographic Details
Main Author: Barros, Diana Manuela Pinto
Publication Date: 2016
Format: Master thesis
Language: eng
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/1822/49099
Summary: Dissertação de mestrado em Bioinformática
id RCAP_32e687d8f7a040d34370059ab0d5e77c
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/49099
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Classification and structure-based inference of transcriptional regulatory proteinsTranscription factorsProtein functional domainsEscherichia coliRegulatory functionTwo-component signal transduction systemsGlobal TFsFactores de transcriçãoDomínios proteicos funcionaisEscherichia coliFuncção regulatóriaEngenharia e Tecnologia::Outras Engenharias e TecnologiasDissertação de mestrado em BioinformáticaTranscription factors (TFs) are proteins that mediate the cellular response to the changes of the surrounding environment. Studying their functional domains and protein structure is fundamental in order to gain insight of the way they are triggered and how they shape genetic transcription. The current work aimed for classifying both TFs and functional domains, understanding which features can be related to the different functions of the TFs. By using UniProtJAPI, a JAVA library that allows remote access to UniProt, the information of 200 Escherichia coli’s (E. coli) TFs has been retrieved. This data was manually curated, in order to remove domain duplicates and other excess information, and to add missing domains. The obtained functional domains were classified according to their molecular function, while the TFs were classified according to their regulatory function. TFs that exclusively induce gene expression were classified as activators, while TFs that only perform gene repression were classified as repressors. On the other hand, TFs that perform both the activation and repression of transcription were classified as duals. The information was then analysed altogether in order to understand what relationships between the TFs’ function and functional domains could exist. Several analysis were performed, which include statistical tests and clustering methods. Along with the analysis of the full list of TFs, TFs that are part of two-component signal transduction systems and global TFs were given special focus, due to their important role in cellular function. The results showed that there is a relationship between the functional domains and the regulatory function of the different TFs. This may be related to the evolutionary relationships between repressors and activators. It is also understandable that dual regulators are closely related to activators and repressors than what activators and repressors are to each other. Moreover, TFs of two-component signal transduction systems are similar to each other, given that they perform similar functions. Their domain architectures are also predictable and do not vary from what was expected of these TFs. However, in global TFs the results are opposite of the ones obtained for two-component system TFs: their structures are very different from each other and each TF is specific. The amount of different domains is high when comparing to the full sample of TFs, since the number of domains exceeds the number of TFs. Domains of all classification types are present in their structure and the domain architectures are varied, which reflects their different activities within the cell.Os factores de transcrição (TFs) são proteínas que mediam resposta celular perante alterações do meio em que se inserem. Estudar os seus domínios funcionais e estrutura proteica é fundamental para compreender a forma como as suas funções são desencadeadas e como moldam a regulação da transcrição. Este trabalho teve como objectivos a classificação dos TFs de acordo com a sua função, assim como a classificação dos domínios funcionais. Através do uso da UniProtJAPI, uma biblioteca de JAVA que permite o acesso remoto à UniProt, foi recolhida informação de 200 TFs da Escherichia coli (E. coli). Estes dados foram curados manualmente, com o objectivo de remover domínios duplicados e outra informação em excesso, assim como de adicionar domínios em falta. Os domínios funcionais obtidos foram classificados de acordo com a sua função molecular, enquanto que os TFs foram classificados de acordo com a sua função regulatória. TFs que exclusivamente induzem a expressão genética foram classificados como activadores, enquanto que TFs que apenas reprimem a expressão genética foram classificados como repressores. Por usa vez, TFs que tanto induzem como reprimem a expressão genética foram classificados como duais. A informação dos domínios e dos TFs foi considerada como um todo de forma a compreender quais as possíveis relações entre a função regulatória dos TFs e os domínios funcionais. Várias análises foram efectuadas, das quais testes estatísticos e métodos de clustering. Para além da análise de todos os TFs, foi também feita uma análise de TFs que fazem parte de two-component transduction systems e TFs globais, devido à sua importância na actividade celular. Os resultados demonstram que existe uma relação entre os domínios funcionais e a função regulatória dos TFs. Esta pode ter a ver com as relações evolucionárias dos activadores e repressores. É, também, perceptível que os reguladores duais relacionam-se com mais proximidade dos activadores e dos repressores do que os activadores e os repressores se relacionam entre si. Para além disso, TFs de two-component transduction systems têm estruturas semelhantes , uma vez que desempenham funções idênticas. As duas arquitecturas de domínios também são previsíveis e não variam do que era esperado. Contudo, para os TFs globais, os resultados são antagónicos: as suas estruturas são diferentes umas das outras e cada TF é específico. A quantidade de domínios diferentes é elevada em comparação com a amostra completa de TFs, uma vez que o número de domínios excede o número de TFs. Domínios de todas as classificações estão presentes na estrutura dos TFs globais e as arquitecturas de domínios são variadas, o que reflecte as suas actividades específicas na célula.Carneiro, S.Lourenço, Anália Maria GarciaUniversidade do MinhoBarros, Diana Manuela Pinto20162016-01-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/1822/49099eng201756200info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T05:30:07Zoai:repositorium.sdum.uminho.pt:1822/49099Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T15:20:39.171334Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Classification and structure-based inference of transcriptional regulatory proteins
title Classification and structure-based inference of transcriptional regulatory proteins
spellingShingle Classification and structure-based inference of transcriptional regulatory proteins
Barros, Diana Manuela Pinto
Transcription factors
Protein functional domains
Escherichia coli
Regulatory function
Two-component signal transduction systems
Global TFs
Factores de transcrição
Domínios proteicos funcionais
Escherichia coli
Funcção regulatória
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
title_short Classification and structure-based inference of transcriptional regulatory proteins
title_full Classification and structure-based inference of transcriptional regulatory proteins
title_fullStr Classification and structure-based inference of transcriptional regulatory proteins
title_full_unstemmed Classification and structure-based inference of transcriptional regulatory proteins
title_sort Classification and structure-based inference of transcriptional regulatory proteins
author Barros, Diana Manuela Pinto
author_facet Barros, Diana Manuela Pinto
author_role author
dc.contributor.none.fl_str_mv Carneiro, S.
Lourenço, Anália Maria Garcia
Universidade do Minho
dc.contributor.author.fl_str_mv Barros, Diana Manuela Pinto
dc.subject.por.fl_str_mv Transcription factors
Protein functional domains
Escherichia coli
Regulatory function
Two-component signal transduction systems
Global TFs
Factores de transcrição
Domínios proteicos funcionais
Escherichia coli
Funcção regulatória
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
topic Transcription factors
Protein functional domains
Escherichia coli
Regulatory function
Two-component signal transduction systems
Global TFs
Factores de transcrição
Domínios proteicos funcionais
Escherichia coli
Funcção regulatória
Engenharia e Tecnologia::Outras Engenharias e Tecnologias
description Dissertação de mestrado em Bioinformática
publishDate 2016
dc.date.none.fl_str_mv 2016
2016-01-01T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/1822/49099
url http://hdl.handle.net/1822/49099
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 201756200
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833595254727507969