Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
Alves, Tiago Lubiana |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/95/95131/tde-17042020-100412/
|
Resumo: |
O advento do sequenciamento de RNA de células únicas trouxe avanços científicos e desafios técnicos. Desenvolver novos métodos de análise é uma etapa crucial paramaximizar a extração de conhecimento desses dados. Neste trabalho, exploramos o reposicionamentode um algoritmo de seleção de características para tratar desafios de dados públicos de RNA de células únicas. Adaptamos o método FCBF (Filtro Rápido Baseado em Correlação, Fast Correlation-Based Filter) para selecionar genes relevantes para distinguir tipos celulares, e encontrar módulos de genes coexpressos. Em dados de células de sangue, notamos que os módulos encontrados correspondiam a programas transcricionais característicos de grupos celulares conhecidos. Em decorrência disso, implementamos uma pipeline capaz de utilizar os módulos de coexpressão para inferir os tipos celulares presentes em conjuntos de dados de forma multinível, evadindo os limites das rotulações únicas tradicionais. Processamos con-juntos de dados de células mononucleares de sangue humano e células embrionárias de peixe-zebra,observando que os módulos e populações encontradas traziam a luz informações biologicamente relevantes. Os algoritmos foram implementados em dois pacotes do Bioconductor, FCBF e fcoex, e estão disponíveis para comunidade, aumentando o arsenal para análise de dados de sequenciamento de RNA de células únicas. |