Resumo: |
A análise de grandes quantidades de dados aproveitando o poder computacional de ferramentas \2015open source\2016 que estão disponíveis na internet é o que veio a conhecer-se como quarto paradigma da investigação científica. Em muitas áreas do conhecimento como a Astronomia, a Física e Geologia, a experimentação, o desenvolvimento teórico e o poder computacional (os três primeiros paradigmas) têm dado lugar à análise rotineira de grandes quantidades de dados e o desenvolvimento de novos métodos, conceitos e teorias que permitam interpretar a informação gerada por novas tecnologias. No campo da biologia, esta mudança nos paradigmas da investigação científica supõe um desafio na hora de encarar uma questão biológica; mas, em contrapartida, ela oferece a oportunidade de validar teorias clássicas e/ou testar hipóteses novas. Precisamente neste contexto, a presente tese aborda duas questões pertinentes ao campo da biologia evolutiva: Quais são os fatores que determinam a evolução de uma proteína? e Qual é a natureza da seleção cinética traducional?. Estas perguntas são, em principio, relevantes no âmbito teórico; por outro lado, sua compreensão, implicações e perspectivas têm também espaço importante na área experimental A tese está estruturada da seguinte forma: No Capitulo um se descreve uma combinação de análise de texto com outras técnicas de mineração de dados para identificar, classificar, integrar e modelar associações existentes entre caracteres genômicos que favorecem ou impedem a acumulação de substituções nucleotídicas ao nível das regiões codificadoras. Nossa metodologia permitiu identificar características genômicas como a eficiência traduçional, a instabilidade estrutural e as regiões de baixa complexidade que em principio poderiam constituir determinantes da evolução das proteínas. Construtos latentes como esquema de integração de dados biológicos mostraram que, em vez de considerar o nível de mRNA como o maior determinante da evolução das proteínas, outras variáveis relacionadas com a expressão de um gene podem ser igualmente importantes Finalmente, graças a um modelo de fatores Bayesiano, foi possível estimar os componentes de um sistema de tradução de proteínas identificado com a eficiência e adaptação da maquinaria celular. No Capitulo dois, o controle cinético exercido pelos códons raros durante a tradução das proteínas é abordado com a ajuda de uma análise de custo-benefício que tenta identificar a natureza do que veio a denominar-se como seleção cinética traducional. Diferenças entre proteínas estáveis e instáveis apóiam permitiram identificar a ação da regulação cinética traducional sobre determinado grupos de genes. Os padrões de substituções sinônimas encontrados nas proteínas instáveis permitiram estender nossa discussão apontando à existência de combinações de códons num espaço genotípico determinado que assegure a conservação da estrutura terciária de uma proteína, mas, ao mesmo tempo procure a otimização da cinética da sua tradução |
---|