Análise de variantes de splicing em homem e camundongo por uma abordagem de proteogenômica

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Silva, Raphael Tavares da
Orientador(a): Passetti, Fabio, Scherer, Nicole de Miranda
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/18748
Resumo: Os avanços obtidos no estudo do transcriptoma pelo uso de sequenciadores de alta vazão e na proteômica por meio da espectrometria de massas, resultaram num grande volume de dados que passou a ser integrado em diversos estudos na Bioinformática. A proteogenômica é a área da pesquisa que reúne essas tecnologias, atuando na interface entre a genômica e a proteômica para interpretar eventos moleculares como, por exemplo, o splicing alternativo. Este evento é capaz de gerar RNAs mensageiros diferentes de um mesmo gene, podendo alterar a sequência polipeptídica após a tradução e consequentemente afetar a função das proteínas. Estudos utilizando dados de RNA-Seq, estimaram que até 90% dos genes humanos sejam afetados por este evento, expandindo assim, a capacidade de geração de proteínas com diferentes funções. Esta tese reúne o desenvolvimento e a aplicação de diferentes abordagens voltadas para a identificação de variantes de splicing em dados de espectrometria de massas de linhagens celulares e amostras de diferentes tecidos de homem e camundongo. Para tal, foram criados repositórios personalizados de sequências proteicas, constituídos por sequências canônicas e peptídeos digeridos in silico derivados de isoformas preditas computacionalmente. O primeiro repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem de células T. Foram identificados 54 peptídeos oriundos de variantes de splicing que não seriam identificados utilizando repositórios tradicionais. O segundo repositório personalizado foi aplicado em dados de espectrometria de massas de uma linhagem celular de oligodendrócitos humanos. Foram identificadas 39 isoformas que apresentaram um perfil de atuação no citoesqueleto desse tipo celular, além de terem sua função discutida no âmbito do tecido cerebral Algumas destas variantes de splicing tiveram a expressão de seus mRNAs confirmada experimentalmente (EEF1D, KRAS, MFF, SDR39U1 e SUGT1). Ademais, foram apresentadas propostas para atribuir maior confiabilidade às isoformas encontradas a partir do número de espectros e peptídeos únicos. O terceiro e quarto repositórios personalizados foram usados em dados de espectrometria de massas das regiões cerebrais de homem e camundongo. Para a composição desses repositórios foi utilizada a montagem de transcriptoma com genoma de referência e de novo para reconstrução de transcritos provenientes de corridas de RNA-Seq. Foram identificadas variantes de splicing já conhecidas e exclusivas derivadas da montagem de transcriptoma. Entre os genes das isoformas encontradas na região do corpo caloso de homem e camundongo, sete foram identificados como ortólogos (CDC42, TPM3, EEF1D, PKM, SEPT7, SET e RUFY3). Até o momento, as abordagens desenvolvidas indicam que a utilização de repositórios proteicos personalizados e a montagem de transcriptoma contribuem para a identificação de isoformas anotadas e potencias variantes de splicing