RNA-Gatherer: uma ferramenta computacional para anotação de RNAs não-codificantes

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Alves Sobrinho, Pitágoras de Azevedo
Orientador(a): Figuerola, Wilfredo Blanco
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/32426
Resumo: RNAs não-codificantes são moléculas que desempenham papéis decisivos na regulação de genes, então identificá-los é essencial para entender a genética de uma espécie. Diversos fatores, como: baixo nível de expressão, amplo espectro de subtipos, atributos diversos, funções heterogêneas e ausência de homologia entre espécies; fazem a detecção de ncRNAs um desafio. Recentemente, novas estratégias de bioinformática vem tentando vencer esses desafios usando modelos de covariância e inteligência artificial. A co-expressão desses genes também vem sendo analisada computacionalmente para revelar quais são suas funções. No entanto, não há consenso sobre quais métricas e parâmetros usar no processo de prever funções. Em organismos pouco conhecidos, como Arapaima gigas, a falta de informações de referência aumenta essa dificuldade. Além disso, principalmente para RNAs longos não-codificantes, há poucas funções conhecidas, o que torna difícil explicar os papéis desses genes e avaliar a qualidade das predições. Neste trabalho, é descrito um software para descobrir os genes não-codificantes, de diversos tipos, e suas funções em espécies de eucariotos. Este foi validado com uma espécie modelo, o camundongo, e utilizado para explorar o panorama de ncRNAs numa espécie pouco estudada, o Arapaima gigas. A comparação da semelhança entre funções de genes co-expressos nos permitiu definir níveis de confiança para as métricas de calcular co-expressão, e assim, desenvolver uma pipeline de predição funções para lncRNA, a qual inclui métricas para calcular correlações não-lineares. O pacote de software descrito aqui fez 63307 anotações não-codificantes em A. gigas, incluindo 11 tipos de ncRNA e 4 de regiões cis-regulatórias. Dessas anotações, apenas 706 eram similares a ncRNAs já conhecidos em outras espécies e os restantes não haviam sido descritos anteriormente. A análise exploratória dos lncRNAs também revelou 19854 lncRNAs de tecido específico e 256 lncRNAs expressos de forma onipresente. Prever as funções dessas moléculas também revelou que elas estão envolvidas na pigmentação da pele, diferenciação sexual, crescimento e defesa contra tumores.