Desenvolvimento de uma abordagem computacional para a tradução in silico de variantes de splicing detectadas no transcriptoma humano

Detalhes bibliográficos
Ano de defesa: 2012
Autor(a) principal: Silva, Raphael Tavares da
Orientador(a): Passetti, Fabio
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Link de acesso: https://www.arca.fiocruz.br/handle/icict/6406
Resumo: Um dos mecanismos capaz de aumentar a diversidade do proteoma de eucariotos é o splicing alternativo nos pré-mRNAs. Este mecanismo celular ocorre durante a transcrição dos genes, sendo ocasionado por um ou mais dos seguintes eventos: retenção de íntrons, uso alternativo de sítio de splice 5', uso alternativo de sítio de splice 3' e uso alternativo de éxons. Análises recentes de Bioinformática utilizando experimentos de RNA-Seq mostram que aproximadamente 90% dos genes humanos produzem mais de um transcrito decorrente de eventos de splicing alternativo. O impacto do splicing alternativo no proteoma humano vem sendo alvo de algumas abordagens de Bioinformática, sendo esperado que uma grande porção de tais transcritos alternativos possa alterar o conteúdo da cadeia polipeptídica obtida após a sua tradução. Devido à sua importância, diversos trabalhos já foram desenvolvidos com o objetivo de facilitar a identificação de eventos de splicing alternativo a partir de dados provenientes de cDNA, bem como sua associação com a estrutura das proteínas de suas isoformas. Entretanto, são poucas as abordagens que realizaram a tradução in silico do transcriptoma humano na busca por variantes de splicing e a utilização de dados oriundos de sequenciadores de segunda geração (NGS) ainda é muito pouco explorada para tratar do tema. Desta maneira, o presente projeto tem como objetivo a aplicação de uma nova abordagem para a identificação e tradução de variantes de splicing alternativo usando dados de NGS. Foram utilizadas leituras da plataforma de sequenciamento Roche/454 oriundas de estudos de câncer para um enriquecimento de nosso banco de dados original que continha previamente mRNAs completos e ESTs. Após o enriquecimento, a metodologia empregada pelo nosso grupo conseguiu detectar 4.574 variantes de splicing inéditas em nosso banco. O novo banco gerado foi traduzido levando a criação de um repertório proteico contendo 159.638 sequências polipeptídicas não redundantes. Na busca por variantes inéditas utilizando dados de proteômica, foram identificadas três possíveis nos genes humanos tubulina 2b, tubulina 4b e actina. Dados de sequenciamento da plataforma Illumina também foram utilizados para uma avaliação da sua contribuição em número de variantes e sequências polipeptídicas traduzidas em nosso repertório. Encontramos que a nossa abordagem foi capaz de anotar 53% mais sequências polipeptídicas quando comparada ao repertório de ENSEMBL Gene. Desta forma, acreditamos que o presente projeto pode auxiliar no melhoramento da anotação de peptídeos encontrados por técnicas de proteômica, bem como no descobrimento de novos marcadores moleculares.