Detalhes bibliográficos
Ano de defesa: |
2023 |
Autor(a) principal: |
Restrepo, Jeffersson Leandro Jimenez |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/9/9142/tde-01112023-144151/
|
Resumo: |
As técnicas de aprendizado de máquina têm se destacado na identificação de padrões em dados de RNA-seq, particularmente no reconhecimento de padrões de expressão gênica associados à sobrevivência em casos de câncer. No entanto, um desafio persistente é a validação destes padrões em novos conjuntos de amostras, visto que a acurácia frequentemente diminui. A razão primária para tal é que muitos desses modelos se baseiam em estruturas matemáticas, sem um embasamento biológico. Para contornar esta limitação, focamos em processos biológicos naturalmente associados com a sobrevida dos pacientes com câncer. Estudos recentes apontam para uma associação entre genes de reparo de DNA e a sobrevivência global em vários tipos de câncer. Com base nisso, nosso trabalho inicial visou criar e validar um score que levasse em conta a expressão destes genes em 32 coortes de pacientes com tumores primários do banco de dados TCGA. Em consequência, a estratégia simples de conformação de 7 scores de desregulação, composto com 10 genes de reparo ao DNA mostrou uma associação com a sobrevida em 31 coortes diferentes, englobando mais de 10,000 pacientes. Além disso, foi possível validar um destes score em dados scRNA-seq de células tumorais de amostras de pacientes com câncer de ovário. Os modelos de aprendizado de máquina na análise de sobrevivência mostraram-se bem ajustados aos conjuntos dados de expressão onde foram gerados. Identificamos nos dois algoritmos surv.blackboost e surv.ranger, junto ao método de composição, as melhores estratégias para a análise de sobrevivência. Em síntese, os scores de desregulação utilizando genes envolvidos nos mecanismos de reparo ao DNA estão associados com a sobrevida global em diferentes tipos de câncer enquanto os métodos de aprendizados tem um overfitting ao conjunto de genes analisados. |