Caracterização in silico e análise de expressão de RNAs não codificadores longos no genoma de eucariotos

Detalhes bibliográficos
Ano de defesa: 2013
Autor(a) principal: Coutinho, Vinicius Ramos Henriques Maracajá
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
RNA
Link de acesso: https://teses.usp.br/teses/disponiveis/95/95131/tde-20230725-114634/
Resumo: Diversos estudos têm revelado que a maior parte das mensagens transcritas nos organismos superiores é composta por RNAs não codificadores de proteínas (ncRNAs). Os estudos finais do projeto ENCODE mostram que cerca de 75% das bases do genoma humano são transcritas. Nosso grupo vem estudando os RNAs longos (> 200 nt) não codificadores (RNAs TINs, RNAs totalmente intrônicos não codificadores e RNAs PIN, parcialmente intrônicos não codificadores) que potencialmente apresentam papéis regulatórios importantes nos genomas eucariotos. Embora vários estudos já tenham sido realizados a fim de elucidar suas funções, ainda há uma enorme escassez de informações ligadas à biologia destes transcritos, sendo necessária uma análise mais extensa e detalhada acerca de como eles são regulados e quais os seus papéis no universo celular. Neste trabalho realizamos uma extensa busca in silico em bancos de dados de ESTs públicas a fim de atualizarmos toda a evidência de atividade transcricional intrônica em 21 diferentes organismos eucariotos. Além disso, realizamos um estudo de expressão intrônica em fígado humano a partir de dados publicados na literatura, obtidos por duas técnicas de expressão gênica em larga-escala: microarranjos de cDNA com sondas intrônico-exônicas 44k e Massively Parallel Signature Sequencing (MPSS). Estes estudos de expressão permitiram identificar milhares de transcritos longos (> 200 nt) parcial ou totalmente intrônicos expressos no fígado humano. Posteriormente realizamos uma completa anotação destes RNAs baseada em homologia e estruturas secundárias evolutivamente conservadas e termodinamicamente estáveis, identificando quais deles seriam possíveis precursores de novas ou já conhecidas classes de ncRNAs. Também verificamos que RNAs não codificadores longos (lncRNAs) intrônicos e intergênicos humanos estão expressos em tecidos pancreáticos normais ou neoplásicos. Estes lncRNAs são transcritos em loci genômicos que estão enriquecidos com marcas de cromatina associadas a regiões promotoras, são conservados em outras espécies e apresentam estruturas secundárias conservadas e estáveis. Além disso, re-analizamos todo o repertório de ESTs públicas do parasita humano prostostomado Schistosoma mansoni, identificando uma variedade de potenciais novos ncRNAs e novos genes ainda não descritos para este organismo. Ainda desenvolvemos uma ferramenta web: NRDR – Noncoding RNA Databases Resource, um repositório online para recuperação de bancos de dados de ncRNAs disponíveis na rede. Também apresentamos o IntromeDB, uma base de dados pública referente a dados da literatura sobre expressão e caracterização deste tipo de ncRNAs intrônicos em organismos eucariotos, obtidos a partir dos mais variados tecidos e condições biológicas. Por fim, desenhamos duas novas plataformas customizadas Agilent de microarray 10 contendo 244 mil sondas para transcritos intrônicos, exônicos e intergênicos humanos. Os resultados obtidos deixam claro que os transcritos intrônicos apresentam diversos sinais biológicos que apontam para um tipo molecular funcional, e que as análises computacionais, em conjunto com estudos de expressão gênica em larga escala (p.ex. microarranjos, MPSS e sequenciadores de última geração), são importantes para o arsenal de ferramentas utilizadas na caracterização biológica destes transcritos.