Desenvolvimento de rede neural convolucional utilizando classificadores para predição da agressividade biológica de subtipos de câncer de mama a partir de imagens de ressonância magnética de pacientes de hospital de referência do interior do estado de São Paulo

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Esposto, Fábio Augusto da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/243059
Resumo: Introdução: O Câncer de Mama é uma doença complexa e heterogênea, atualmente classificada em subtipos específicos que estão associados a diferentes prognósticos. A biópsia continua sendo o padrão-ouro para identificação dos biomarcadores, mas tem importantes limitações. A utilização de Aprendizagem de Máquina (AM) não é uma novidade na pesquisa do câncer. Redes neurais artificiais (RNAs) têm sido usadas na detecção e diagnóstico de câncer há aproximadamente 20 anos. Objetivos: Assim, essa pesquisa tem como objetivo desenvolver uma rede neural convolucional (RNC) que possa prever o subtipo específicos de um câncer de mama, classificados pela imuno-histoquímica, com base em imagens obtidas por ressonância magnética. Métodos: O estudo foi realizado no Hospital das Clínicas da Faculdade de Medicina de Botucatu em exames de ressonância magnética de 76 pacientes de gênero feminino. Os cortes das imagens de ressonância magnética foram usados para segmentação dos subtipos tumorais. Uma arquitetura de RNC foi projetada com uma máquina de Boltzmann convolucional personalizada utilizando exame de ressonância magnética de 76 pacientes, contendo 10 imagens cada, que foram utilizadas para treinamento e validação da RNC. As imagens foram ajustadas para validação. Um conjunto balanceado de 40 imagens (exame de 4 pacientes) foram utilizadas para definição de testes, sendo imagens de uma paciente para cada subtipo tumoral (Luminal A, Luminal B, HER2+ e Triplo Negativo). O código do software foi escrito em Python em uma estação de trabalho pessoal. Resultados e discussão: Dez imagens de cada subtipo tumoral foram avaliados (Luminal A, Luminal B, HER2+ e triplo negativo). Foram analisados o desempenho de cinco métodos classificadores utilizados em Machine Learning: K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Gaussian Naïve Bayes (GNB), SOFTMAX e Random Forest (RF). Esses algoritmos possuem variáveis definidas antes do treinamento, chamadas de hiperparâmetros. As métricas do conjunto de teste foram avaliadas de acordo com: precisão, revocação (recall), resultado f1 (f1 score) e acurácia. O algoritmo classificador SoftMax apresentou um resultado de melhor comparação em relação aos demais classificadores, em todas as métricas analisadas, apresentando a matriz de confusão com melhor acurácia, com média aproximada de 35% de precisão. Deste modo, optou-se por realizar testes com uma classificação binária (hormonal e não hormonal) com o algoritmo classificador de melhor resultado no estudo, o SoftMax. Assim, atingiu-se uma porcentagem de acurácia de 65%, apresentando-se como um classificador mais promissor na classificação binária (hormonal e não hormonal) de câncer de mama. Considerações finais: A análise de ressonância magnética de câncer de mama com a utilização de uma nova Rede Neural Convolucional pode realizar uma classificação binária de câncer de mama com uma precisão de 65%. Evidências mostram que conjuntos de dados maiores levam a um maior desempenho do modelo proposto. Assim, como continuidade desta pesquisa, serão utilizados maiores números de conjuntos de dados e outros classificadores em novos testes, com intuito de obter resultados mais promissores.