Mineração de subgrupos aplicada a dados de metilação de pacientes com câncer de mama

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: CARVALHO NETO, George de Vasconcelos
Orientador(a): PRUDÊNCIO, Ricardo Bastos Cavalcante
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/46426
Resumo: O câncer de mama é um dos tipos de câncer mais prevalentes em mulheres. Com uma ênfase crescente na pesquisa relacionada ao câncer muitos trabalhos foram realizados para classificar o diagnóstico, a sobrevivência e a recorrência desse tipo de câncer. Como um dos biomarcadores epigenéticos mais bem descritos em cânceres humanos, a metilação do DNA desempenha um papel essencial na regulação da expressão gênica, além de estar implicada no prognóstico e na terapêutica de muitos tipos de câncer. Nesse estudo exploramos os perfis de metilação de DNA capturando grupos de pacientes com câncer de mama que possuem diferentes marcadores e possível diversidade fenotípica visando melhorar o prognóstico desses pacientes no nível epigenético. Perfis de metilação do DNA de um estudo caso-controle com 235 indivíduos com câncer de mama e 424 indivíduos com diagnóstico negativo para câncer foram obtidos do banco de dados Gene Expression Omnibus (GEO). Os marcadores diferencialmente metilados foram identificados por teste T moderado. Novas características foram adicionadas aos dados usando ferramentas de predição de idade biológica, tipos celular e condição de fumante. Subgrupos de pacientes foram encontrados usando as ferramentas de mineração de subgrupos Beam search e SSDP+. Um total de 20 subgrupos foram selecionados, onde 10 subgrupos foram encontrados pelo algoritmo Beam search e os outros 10 subgrupos pelo algoritmo SSDP+. O algoritmo Beam search encontrou subgrupos com mais elementos e com alto grau de redundância englobando diferentes genes relacionados previamente ao câncer de mama. Já o algoritmo SSDP+ encontrou subgrupos com menos elementos e alto grau de diversidade, mas que por englobar menos regiões não tiveram genes previamente relacionados a câncer de mama. Nosso estudo identificou múltiplos painéis de metilação de DNA associados a grupos específicos de pacientes com câncer de mama que podem, se validados clinicamente, ser úteis para a previsão do risco de câncer de mama no futuro.