Detalhes bibliográficos
Ano de defesa: |
2015 |
Autor(a) principal: |
Valeije, Ana Claudia Mancusi |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://www.teses.usp.br/teses/disponiveis/95/95131/tde-23042015-133407/
|
Resumo: |
Os projetos genoma têm fornecido uma grande quantidade de informação sobre a arquitetura gênica e sobre a configuração física de suas respectivas regiões flanqueadoras (RF). Estas RF contêm informações com o potencial de auxiliar na elucidação de vários processos biológicos, como os mecanismos de expressão gênica e de sua regulação. Estes mecanismos são de extrema importância para a compreensão do correto funcionamento dos organismos e das patologias que os afetam. Uma parte significativa dos mecanismos de controle de expressão gênica atuam na fase transcricional. Na base destes mecanismos está o recrutamento de proteínas que se ligam às regiões promotoras da transcrição, as quais são segmentos específicos de DNA que podem estar localizados tanto próximos à região de início da transcrição (TSS) quanto a centenas ou até a milhares de pares de bases dela. Essas proteínas compõem a maquinaria transcricional e podem ativar ou inibir o processo de transcrição. Experimentalmente, os segmentos regulatórios podem ser identificadas utilizando métodos complexos de biologia molecular, tais como SELEX, ChiP-ChiP, ChIP-Seq, dentre outros. Uma estratégia alternativa aos métodos experimentais é a utilização de metodologias computacionais. Análises computacionais tendem a ser mais rápidas, baratas e flexíveis do que protocolos experimentais, além de poderem ser utilizadas em larga escala. Atualmente, os métodos computacionais disponíveis necessitam de informações experimentais para a definição de padrões globais de preferências de sequências de DNA para a ligação de fatores de transcrição (TFBS, em inglês transcription factor binding sites). Entretanto, esses métodos apresentam uma elevada taxa de falso positivos e, por vezes, apresentam também taxas significativas de falso negativos, além de serem limitados ao estudo de fatores de transcrição de espécies bem conhecidas, o que diminui a área de aplicação dos mesmos. Diante deste cenário, o uso de métodos computacionais que não necessitem da informação referente aos sítios de ligação, bem como os que utilizem parâmetros mais robustos de detecção dos resultados, em detrimento dos escores de pontuação provindos de alinhamentos, podem acrescentar uma sensível melhoria ao processos de predição de regiões regulatórias. Neste projeto, foi desenvolvido um novo modelo computacional (TFBSAnalyzer) para análise e identificação de TFBS em elementos regulatórios, que utiliza técnicas de modelagem molecular para a construção de complexos entre um fator de transcrição ancorado a estruturas de DNA com sequências variáveis de bases e, através de cálculos termodinâmicos de entalpia de ligação, determina uma função de pontuação baseada na energia de ligação e realiza a predição de sítios de ligação ao DNA para o fator de transcrição em análise. Esta abordagem foi testada com três fatores de transcrição como sistemas-modelo, pertencentes à família dos receptores nucleares, a saber: o receptor de estrógeno ER-alfa (Estrogen Receptor Alpha), o receptor de ácido retinoico RAR-beta (Retinoid Acid Receptor Beta) e o receptor X retinóico RXR (Retinoid X Receptor). Os modelos previstos computacionalmente foram comparados aos dados experimentais disponíveis para estes receptores nucleares, os quais apresentaram as seguintes taxas de FP/FN: 10%/0 para RAR-beta e RXR, 21%/6% para ER-alfa. Também simulamos um experimento de ChIP-seq do ER-alfa no genoma humano, cujos genes selecionados foram submetidos a uma análise de enriquecimento de fatores de transcrição curados experimentalmente, que fazem sua regulação, revelando que o receptor de estrógeno está realmente envolvido no processo. Para mostrar a aplicabilidade geral de nosso método, nós modelamos a distribuição de energia de ligação para o receptor NHR-28 isoforma a de Caenorhabditis elegans com DNA . Obtivemos distribuições de energia semelhantes àquelas encontradas para os NRs modelos, portanto seria possível aplicar o método para buscar possíveis TFBSs para este receptor no genoma de C. elegans. Os dados gerados e as metodologias desenvolvidas neste projeto devem acrescentar uma sensível melhoria aos processos de predição de regiões regulatórias e consequentemente auxiliar no entendimento dos mecanismos envolvidos no processo de expressão gênica e de sua regulação. |