Transcriptoma, sítios de ligação para fatores de transcrição e região promotora de cana-de-açúcar

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Oliveira, Mauro de Medeiros
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/95/95131/tde-10122018-101543/
Resumo: O Brasil tem a maior produção de cana-de-açúcar do mundo. O cultivo de cana-de-açúcar no Brasil está voltado principalmente para a produção de açúcar ou Etanol e nos últimos anos para a produção de bioeletricidade através da utilização da biomassa do bagaço e da palha. Apesar da importância econômica e do potencial sustentável que a cana-de-açúcar apresenta, o genoma de referência para esta cultura ainda não está disponível na literatura. A principal justificativa para isso está na complexidade do mesmo, em especial pela alopoliploidia e autopoliploidia. De fato esta característica é a principal barreira para o desenvolvimento de novas variedades comerciais. Na literatura há diferentes estratégias que visam contribuir com o conhecimento genômico de cana-de-açúcar sendo mais prevalente dados de transcriptoma e pouca informação sobre o processo de regulação gênica. Além disso, diferente do que é observado em outras culturas comerciais, em cana-de-açúcar não há trabalhos associados com a caracterização in silico da região Promotora, assim como na identificação de sítios de ligação para Fatores de Transcrição (TFBSs). Por esta razão, o nosso trabalho foi direcionado para a caracterização in silico de regiões regulatórias em cana-de-açúcar. Para esta tarefa nós realizamos apenas a rotulação de sequências de DNA não codificante que estavam a upstream de cada gene anotado em cana-de-açúcar. Todos os genes foram selecionados de dados de transcriptoma e a sequência de DNA da região Promotora foi isolada do Genespace de cana-de-açúcar SP80-3280 gerado pelo projeto de sequenciamento do genoma de referência do nosso grupo. A rotulação da região regulatória em cana-de-açúcar foi executada em duas subsequências: Core Promoter e Promotor Proximal. Na região Core Promoter nós realizamos a identificação do sítio de inicio de transcrição (TSS), a estimativa do tamanho da região 5\' UTR e a classificação da região Core Promoter em TATA-box ou TATA-less. Todos os processos foram realizados através da ferramenta TSSPlant. A utilização da ferramenta TSSPlant motivou o desenvolvimento de uma nova ferramenta para predição do sinal de TSS que aqui chamamos de TSSFinder. A ferramenta TSSinder apresentou resultados de predição do sinal de TSS superior aos seus pares, além disso esta ferramenta foi bem sucedida em diferentes organismos como Arabidopsis thaliana, Gallus gallus e Saccharomyces cerevisiae. Na região Promotora Proximal nós realizamos a identificação de TFBSs através de duas metodologias: predição de novo e mapeamento de matrizes de TFBS (PSSM). O processo de predição de novo foi realizada por meio de dois modelos: Maximização da expectativa e Gibbs Sampler e esse processo foi executado apenas para o subgrupo de genes co-expressos ou apenas para o conjunto de sequências homeólogas de cada gene de cana-de-açúcar selecionado. Para o restante das sequências foi realizado apenas o mapeamento das matrizes de TFBSs identificadas durante o processo de predição de novo. Em paralelo todos TFBSs identificados no nosso trabalho foram comparados com o banco de TFBS para plantas. Através desse procedimento foi possível estimar qual classe de Fator de Transcrição está interagindo com o TFBS identificado na região Promotora Proximal dos genes Scdr1, ScSuSy, ScPAL. Com este trabalho, nós cobrimos parte da lacuna observada em estudos in silico paras regiões regulatórias de cana-de-açúcar. Além disso, nós aperfeiçoamos o processo de identificação do sinal de TSS para diferentes organismos; inclusive para plantas Dicotiledôneas e Monocotiledôneas.