Caracterização computacional de RNAs não codificantes longos a nível unicelular associados com o desenvolvimento do tecido cardíaco e com doenças cardiovasculares

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Ramos, Thaís de Almeida Ratis
Orientador(a): Coutinho, Vinicius Ramos Henriques Maracajá
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio Grande do Norte
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM BIOINFORMÁTICA
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/handle/123456789/49581
Resumo: Os RNAs longos não codificantes (lncRNAs) compreendem as unidades transcricionais mais representativas do genoma dos mamíferos e estão associados ao desenvolvimento de órgãos que podem estar associados ao surgimento de doenças, como as cardiovasculares. A Organização Mundial da Saúde (do inglês, World Health Organization (WHO)), por exemplo, publicou que as doenças cardiovasculares são responsáveis pela morte de 17,9 milhões de pessoas a cada ano, correspondendo a 31% de todas as mortes em todo o mundo. Neste trabalho, foi construída uma base de dados de referência de lncRNAs e transcritos codificantes: foi utilizado uma combinação dos lncRNAs das bases de dados Gencode (M20), Ensembl (GRCm38.95) e Amaral et al (2018) para definir o conjunto de lncRNAs de referência não redundantes, ou seja, lncRNAs que não possuíam sobreposição acima de 50%; ademais, para a base de dados de referência dos transcritos codificantes foi utilizada a base de dados Gencode (M20). Além disso, foram utilizadas abordagens de bioinformática (foi adaptado um pipeline de RNA-seq para análise de dados single-cell), algoritmos de aprendizado de máquina (Hierárquico, Silhueta, PCA e t-SNE) e técnicas estatísticas para definir lncRNAs envolvidos no desenvolvimento cardíaco de mamíferos. Para isso, foi utilizado a base dados de single-cell publicada por DeLaughter et al (2016), no qual havia dados de 4 estágios embrionários (E9.5, E11.5, E14.5, E18.5) e 4 estágios pós-natais (P0, P3, P7, P21) do organismo modelo mus musculus. Neste trabalho, identificamos 8 tipos celulares distintos e novos transcritos marcadores (codificantes e diferentes tipos de lncRNAs) com o auxílio da ferramenta M3Drop e de testes estatísticos (Qui-quadrado e teste de aderência). Além disso, a expressão diferencial e análise de enriquecimento funcional revelaram subpopulações de cardiomiócitos associadas à função cardíaca; enquanto isso, a análise de co-expressão modular revelou insights funcionais específicos de células para lncRNAs durante o desenvolvimento do miocárdio, incluindo uma potencial associação com genes-chave relacionados à doença e ao “programa de genes fetais”. Nossos resultados evidenciam o papel de lncRNAs particulares no desenvolvimento do coração e destacam o uso de abordagens modulares de co-expressão na definição funcional do tipo de célula. Como trabalho futuro, pretende-se identificar os papéis funcionais desses RNAs no desenvolvimento de tecidos cardíacos e em doenças cardiovasculares, utilizando abordagens de validação experimental.