Análise de RNAs longos não codificantes do genoma de Arabidopsis thaliana (L.) Heynh
Ano de defesa: | 2017 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Goiás
Instituto de Ciências Biológicas - ICB (RG) Brasil UFG Programa de Pós-graduação em Genética e Biologia Molecular |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://repositorio.bc.ufg.br/tede/handle/tede/7249 |
Resumo: | O sequenciamento em larga escala de transcritos, via RNA-Seq, vêm mudando paradigmas ao demonstrar que a transcrição é prevalente por todo o genoma dos eucariotos. Nesses organismos, a grande maioria dos transcritos não codificam proteínas (ncRNA). Um tipo de RNA que vêm despertando grande interesse, dado sua prevalência, são os RNAs longos não codificantes (lncRNAs), que são ncRNA com mais de 200 nucleotídeos. No entanto, pouco se sabe sobre o seu papel e prevalência nos genomas de plantas, mesmo em espécies modelo como Arabidopsis thaliana (L.) Heynh. O objetivo desse trabalho foi identificar lncRNAs no genoma de Arabidopsis e caracterizar seus tamanhos, estruturas e diversidade genética. As sequências utilizadas foram obtidas de um trabalho que sequenciou RNA total de A. thaliana, sob diferentes regimes de luminosidade, utilizando a plataforma Illumina HiSeq 2000. Estas sequências foram mapeadas no genoma referência com o programa TopHat e montadas com o Cufflinks. Os transcritos montados foram comparados com a anotação do genoma com o Cuffcompare, afim de identificar transcritos ainda não anotados. Um total de 4.305 RNAs longos putativos foi obtido, sendo 314 (7%) senso em relação a transcritos codantes (mRNAs), 392 (9%) intergênicos, 2.216 intrônicos (52%) e 1.383 (32%) antisenso de mRNAs. Os lncRNAs obtidos foram filtrados para eliminar aqueles com potencial de codificação, bem como aqueles relacionados com a síntese rRNA, tRNA e miRNA. Após essa filtragem, foram obtidos 3.710 lncRNAs de alta cofiança (HC-lncRNA), sendo que desses 58,6% ainda não foram previamente anotados. Esses HC-lncRNA representam uma baixa proporção (~1%) do genoma de Arabidopsis thaliana. Uma análise de enriquecimento funcional de categorias do Gene Ontology (GO) demonstrou que os genes que contém lncRNAs apresentam enriquecimento para processos ligados à localização e transporte de proteínas dentro da célula, bem como para ligação a ácidos nucléicos. Uma análise de expressão gênica identificou apenas 22 lncRNAs diferencialmente expressos entre as diferentes condições de luminosidade em que as amostras foram expostas. Utilizando os SNPs do projeto 1001 genomes, identificou-se alta diversidade nucleotídica em regiões de lncRNAs, indicando baixa conservação da estrutura primária destes transcritos. A diversidade nucleotídica em regiões de RNAs longos não codificantes é menor do que em regiões codantes, mas menor do que a diversidade observada em regiões neutras como os pseudogenes. |