Detalhes bibliográficos
| Ano de defesa: |
2022 |
| Autor(a) principal: |
Molan, André Luiz [UNESP] |
| Orientador(a): |
Não Informado pela instituição |
| Banca de defesa: |
Não Informado pela instituição |
| Tipo de documento: |
Tese
|
| Tipo de acesso: |
Acesso aberto |
| Idioma: |
por |
| Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: |
|
| Link de acesso: |
http://hdl.handle.net/11449/238244
|
Resumo: |
O neuroblastoma é o tumor sólido extracraniano mais comum em indivı́duos com idade inferior a 15 anos. É uma doença extremamente heterogênea, podendo regredir ou evoluir de forma espontânea e, em alguns casos, se mostrar bastante agressiva. Alguns sistemas como o International Neuroblastoma Staging System (INSS) e o International Neuroblastoma Patho- logy Classification (INPC), permitem classificar o estágio da doença, relacionando-o a um prognóstico favorável ou desfavorável com base em caracterı́sticas histológicas. Com o surgimento das tecnologias de sequenciamento NGS, associadas a técnicas como o RNA-seq, mo- delos preditivos robustos e versáteis puderam ser desenvolvidos e aplicados ao câncer. Várias abordagens para o estudo de neoplasias pediátricas, entretanto, foram adaptadas de pesquisas oncológicas relacionadas a adultos. Porém, cânceres infantis apresentam taxas de mutações recorrentes muito baixas em relação a adultos, demandando novas abordagens para melhor compreender vulnerabilidades e etiologias especı́ficas. Nos últimos anos, um aumento de memória, poder de processamento e capacidade de armazenamento aumentaram a importância da computação para a biologia, tornando possı́vel a implementação de abordagens capazes de resolver problemas antes considerados difı́ceis. Dentre elas, destaca-se o aprendizado de máquina, o qual permite modelar a relação entre um conjunto de valores observáveis (entradas) e um grupo de variáveis relacionadas a estes valores (saı́das). Neste contexto, utilizamos regressão logı́stica, redes neurais artificiais com multilayer perceptron e árvore de decisão, todas técnicas de aprendizado supervisionado, para a análise de assinaturas transcricionais em dados de RNA-seq de pacientes com neuroblastoma. Desenvolvemos diferentes modelos preditivos baseados nas variáveis sobrevivência, progressão do tumor, alto risco e classe tumoral, com o propósito de caracterizar prognósticos clı́nicos favoráveis e desfavoráveis. Aplicamos recursos de bibliotecas das linguagens Python e R na criação dos modelos, seleção de features e ba- lanceamento dos dados. Dentre os principais resultados, conseguimos, por exemplo, predizer a sobrevivência (vivo ou morto) com 91,33% de acurácia. Além disso, para compreendermos biologicamente o melhor modelo encontrado, conduzimos uma análise de enriquecimento funcional em termos de processos biológicos do Gene Ontology e ontologias relacionadas à doenças - este, através da biblioteca DOSE da linguagem R. Isso nos permitiu associar as fe- atures (subconjunto de transcritos utilizados pelo modelo) a processos biológicos relacionados à funções de desenvolvimento e divisão celular, além de ontologias de doenças referentes ao neuroblastoma. |