Detalhes bibliográficos
Ano de defesa: |
2025 |
Autor(a) principal: |
Petrini, Daniel Gustavo Pellacani |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3142/tde-14032025-073816/
|
Resumo: |
A mamografia, um exame de triagem baseado em raios-x, desempenha um papel essencial na detecção precoce do câncer de mama. Ela requer a interpretação cuidadosa de radiologistas experientes para reduzir a taxa de erro. Para auxiliar nesse processo, sistemas de detecção e diagnóstico auxiliado por computador têm sido desenvolvidos, especialmente impulsionados pelos avanços na inteligência artificial e nas técnicas de aprendizado de máquina. Estudos recentes indicam que redes neurais profundas apresentam um desempenho comparável ou até superior ao de especialistas humanos no diagnóstico dessa doença. Apesar do sucesso das redes neurais convolucionais na classificação de imagens naturais, a classificação de mamografias apresenta desafios únicos devido ao pequeno tamanho das regiões de interesse e à altíssima resolução das imagens. Consequentemente, abordagens tradicionais de classificação de imagens frequentemente não funcionam bem em mamografias. Shen et al. (2019) propuseram fazer duas transferências de aprendizado: primeiro treinando classificadores de pequenos recortes (patches) e segundo utilizando esses classificadores para melhorar a classificação de mamografias inteiras. Este trabalho objetiva aprimorar a detecção de câncer em mamografias. Na primeira etapa, melhoramos os resultados de Shen et al. de duas formas: (1) Substituindo o modelo-base antigo ResNet50 pelo moderno EfficientNet. (2) Fazendo uma terceira transferência de aprendizado para obter o classificador de duas vistas que usa simultaneamente as duas incidências de mamografia. O modelo resultante é treinado de ponta a ponta. Testamos essas ideias de duas formas usando o conjunto CBIS-DDSM: (a) No teste validação cruzada de 5 partições, a ideia (1) aumentou AUC (Area Under Curve) de 0,8512 para 0,8757 e a ideia (2) aumentou para 0,9298. Usando test time augmentation e ensemble de 4 modelos, atingimos AUC de 0,9344. (b) No teste divisão original, a ideia (1) aumentou AUC de 0,7590 para 0,8033 e a ideia (2) aumentou para 0,8418. Fazendo exploração de arquiteturas da segunda etapa, obtivemos aumento de AUC para 0,8643 e 0,8658 respectivamente sem e com test time augmentation. Este último parece ser o melhor resultado para este problema, segundo o nosso conhecimento. Na segunda etapa, fizemos uma série de testes para responder questões em aberto: (1) Usar o classificador de recortes, como proposto por Shen et al., é realmente necessário? Concluímos que usar esse classificador intermediário não é necessário para mamografias de baixa qualidade, mas é necessário para mamografias de alta qualidade. (2) Os modelos com desempenho melhor em classificar imagens naturais também são melhores para classificar mamografias? Concluímos que isto é normalmente verdade para classificadores baseados em recortes, mas não vale para classificadores que não usam recortes. (3) É possível reduzir a resolução de uma mamografia para de 1.152×892 para 576×448 sem comprometer o desempenho de classificação? Concluímos que o desempenho sempre diminui quando se diminui a resolução. (4) Reduzir mamografias usando técnica learn to resize é melhor do que usar técnicas clássicas? Constatamos que o algoritmo learn to resize é pior do que as técnicas clássicas para diminuir resolução de mamografias em todos os testes. (5) O classificador de duas vistas proposto realmente proporciona um ganho de desempenho? Concluímos que o aumento de desempenho do classificador de duas vistas é real e estatisticamente significativo. |