Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias

Bibliographic Details
Main Author: Moreira, Cristina Isabel da Silva
Publication Date: 2023
Format: Master thesis
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/10400.22/24328
Summary: O Cancro da Mama é uma das patologias mais prevalentes mundialmente e uma das principais causas de mortalidade por cancro associado ao sexo feminino em Portugal. O diagnóstico de patologias mamárias que é feito através de biópsias é uma tarefa complexa e detalhada para os Patologistas e como tal suscetível a erros. É exigido uma análise meticulosa e especializada de múltiplos campos microscópicos, onde a precisão é vital e os atrasos podem ser críticos. Neste sentido, o desenvolvimento de plataformas que auxiliem a um diagnóstico rápido e preciso é cada vez mais essencial. Neste projeto foi desenvolvido um dataset de imagens histológicas de biópsias mamárias para o diagnóstico de patologias mamárias, com o objetivo de aplicar e avaliar a eficácia das redes neuronais na classificação e análise destes tecidos. O processo de criação do dataset resume-se à recolha do tecido, seguindo o seu processamento laboratorial onde as lâminas obtidas foram digitalizadas e submetidas a um processo de conversão e segmentação para formatos compatíveis com a posterior análise. A organização e categorização das imagens foi efetuada em código Python para a classificação automatizada, garantindo a integridade e precisão dos dados. A fase de pré-processamento e organização do dataset foram essenciais para assegurar a qualidade e representatividade dos dados. A precisão das categorizações e a distribuição equilibrada das imagens nas respetivas categorias para treino e validação dos modelos foram cruciais. A normalização das imagens e a extração adequadas dos segmentos de interesse foram etapas fundamentais para preparar os dados para a análise das redes neuronais. Esta preparação dos dados assegurou que os modelos fossem treinados com as informações corretas e essenciais para garantir a eficácia da aprendizagem. Para a aplicação das redes neuronais, foram selecionados os modelos SqueezeNet e InceptionV3, onde foram testados quatros cenários de classificação em ambas as arquiteturas e utilizadas quatro classes patológicas diferentes (Doença Fibrocística, Fibroadenoma, Carcinoma Lobular Invasivo e Carcinoma Ductal Invasivo). Estes modelos foram adaptados com camadas de entrada e saída personalizadas. A eficácia destes modelos foi avaliada com métricas estatísticas e gráficas incluindo a matriz de confusão, exatidão (accuracy), precisão (precision), sensibilidade (recall), F1-score e ainda as curvas de ROC e Precision-Recall. Ambos os modelos demonstraram uma boa performance com uma accuracy que variou entre os 88% e os 98% para todos os cenários testados. Porém, foi observado que o modelo InceptionV3 é o mais bem-sucedido, obtendo na maioria dos casos os valores mais altos de accuracy apesar de se ter observado alguma variação devido a fenómenos como overfitting. Os resultados obtidos indicam que as redes neuronais podem ser ferramentas eficazes no diagnóstico de patologias mamárias a partir de imagens histológicas. A accuracy elevada dos modelos utilizados para desenvolvimento deste projeto, refletem a capacidade de reconhecer e classificar de forma precisa as características morfológicas relevantes nas imagens, demonstrando que a Inteligência Artificial tem um potencial significativo para melhorar a precisão e eficácia dos diagnósticos em Anatomia Patológica.
id RCAP_2cd360d83cdb52d979c454985d7cb0b8
oai_identifier_str oai:recipp.ipp.pt:10400.22/24328
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias MamáriasCreation of a Database of Annotated Histological Images and Development of an Automatic Classification Model for Breast PathologiesBreast CancerNeural NetworksMachine LearningSqueezeNetInceptionV3O Cancro da Mama é uma das patologias mais prevalentes mundialmente e uma das principais causas de mortalidade por cancro associado ao sexo feminino em Portugal. O diagnóstico de patologias mamárias que é feito através de biópsias é uma tarefa complexa e detalhada para os Patologistas e como tal suscetível a erros. É exigido uma análise meticulosa e especializada de múltiplos campos microscópicos, onde a precisão é vital e os atrasos podem ser críticos. Neste sentido, o desenvolvimento de plataformas que auxiliem a um diagnóstico rápido e preciso é cada vez mais essencial. Neste projeto foi desenvolvido um dataset de imagens histológicas de biópsias mamárias para o diagnóstico de patologias mamárias, com o objetivo de aplicar e avaliar a eficácia das redes neuronais na classificação e análise destes tecidos. O processo de criação do dataset resume-se à recolha do tecido, seguindo o seu processamento laboratorial onde as lâminas obtidas foram digitalizadas e submetidas a um processo de conversão e segmentação para formatos compatíveis com a posterior análise. A organização e categorização das imagens foi efetuada em código Python para a classificação automatizada, garantindo a integridade e precisão dos dados. A fase de pré-processamento e organização do dataset foram essenciais para assegurar a qualidade e representatividade dos dados. A precisão das categorizações e a distribuição equilibrada das imagens nas respetivas categorias para treino e validação dos modelos foram cruciais. A normalização das imagens e a extração adequadas dos segmentos de interesse foram etapas fundamentais para preparar os dados para a análise das redes neuronais. Esta preparação dos dados assegurou que os modelos fossem treinados com as informações corretas e essenciais para garantir a eficácia da aprendizagem. Para a aplicação das redes neuronais, foram selecionados os modelos SqueezeNet e InceptionV3, onde foram testados quatros cenários de classificação em ambas as arquiteturas e utilizadas quatro classes patológicas diferentes (Doença Fibrocística, Fibroadenoma, Carcinoma Lobular Invasivo e Carcinoma Ductal Invasivo). Estes modelos foram adaptados com camadas de entrada e saída personalizadas. A eficácia destes modelos foi avaliada com métricas estatísticas e gráficas incluindo a matriz de confusão, exatidão (accuracy), precisão (precision), sensibilidade (recall), F1-score e ainda as curvas de ROC e Precision-Recall. Ambos os modelos demonstraram uma boa performance com uma accuracy que variou entre os 88% e os 98% para todos os cenários testados. Porém, foi observado que o modelo InceptionV3 é o mais bem-sucedido, obtendo na maioria dos casos os valores mais altos de accuracy apesar de se ter observado alguma variação devido a fenómenos como overfitting. Os resultados obtidos indicam que as redes neuronais podem ser ferramentas eficazes no diagnóstico de patologias mamárias a partir de imagens histológicas. A accuracy elevada dos modelos utilizados para desenvolvimento deste projeto, refletem a capacidade de reconhecer e classificar de forma precisa as características morfológicas relevantes nas imagens, demonstrando que a Inteligência Artificial tem um potencial significativo para melhorar a precisão e eficácia dos diagnósticos em Anatomia Patológica.Coelho, Luís Filipe Martins PintoREPOSITÓRIO P.PORTOMoreira, Cristina Isabel da Silva2023-12-20T12:04:10Z2023-11-282023-11-28T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.22/24328urn:tid:203435877porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-03-07T09:59:18Zoai:recipp.ipp.pt:10400.22/24328Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T00:24:28.385500Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
Creation of a Database of Annotated Histological Images and Development of an Automatic Classification Model for Breast Pathologies
title Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
spellingShingle Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
Moreira, Cristina Isabel da Silva
Breast Cancer
Neural Networks
Machine Learning
SqueezeNet
InceptionV3
title_short Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
title_full Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
title_fullStr Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
title_full_unstemmed Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
title_sort Criação de Bases de Dados de Imagens Histológicas Anotadas e Desenvolvimento de um Modelo de Classificação Automática de Patologias Mamárias
author Moreira, Cristina Isabel da Silva
author_facet Moreira, Cristina Isabel da Silva
author_role author
dc.contributor.none.fl_str_mv Coelho, Luís Filipe Martins Pinto
REPOSITÓRIO P.PORTO
dc.contributor.author.fl_str_mv Moreira, Cristina Isabel da Silva
dc.subject.por.fl_str_mv Breast Cancer
Neural Networks
Machine Learning
SqueezeNet
InceptionV3
topic Breast Cancer
Neural Networks
Machine Learning
SqueezeNet
InceptionV3
description O Cancro da Mama é uma das patologias mais prevalentes mundialmente e uma das principais causas de mortalidade por cancro associado ao sexo feminino em Portugal. O diagnóstico de patologias mamárias que é feito através de biópsias é uma tarefa complexa e detalhada para os Patologistas e como tal suscetível a erros. É exigido uma análise meticulosa e especializada de múltiplos campos microscópicos, onde a precisão é vital e os atrasos podem ser críticos. Neste sentido, o desenvolvimento de plataformas que auxiliem a um diagnóstico rápido e preciso é cada vez mais essencial. Neste projeto foi desenvolvido um dataset de imagens histológicas de biópsias mamárias para o diagnóstico de patologias mamárias, com o objetivo de aplicar e avaliar a eficácia das redes neuronais na classificação e análise destes tecidos. O processo de criação do dataset resume-se à recolha do tecido, seguindo o seu processamento laboratorial onde as lâminas obtidas foram digitalizadas e submetidas a um processo de conversão e segmentação para formatos compatíveis com a posterior análise. A organização e categorização das imagens foi efetuada em código Python para a classificação automatizada, garantindo a integridade e precisão dos dados. A fase de pré-processamento e organização do dataset foram essenciais para assegurar a qualidade e representatividade dos dados. A precisão das categorizações e a distribuição equilibrada das imagens nas respetivas categorias para treino e validação dos modelos foram cruciais. A normalização das imagens e a extração adequadas dos segmentos de interesse foram etapas fundamentais para preparar os dados para a análise das redes neuronais. Esta preparação dos dados assegurou que os modelos fossem treinados com as informações corretas e essenciais para garantir a eficácia da aprendizagem. Para a aplicação das redes neuronais, foram selecionados os modelos SqueezeNet e InceptionV3, onde foram testados quatros cenários de classificação em ambas as arquiteturas e utilizadas quatro classes patológicas diferentes (Doença Fibrocística, Fibroadenoma, Carcinoma Lobular Invasivo e Carcinoma Ductal Invasivo). Estes modelos foram adaptados com camadas de entrada e saída personalizadas. A eficácia destes modelos foi avaliada com métricas estatísticas e gráficas incluindo a matriz de confusão, exatidão (accuracy), precisão (precision), sensibilidade (recall), F1-score e ainda as curvas de ROC e Precision-Recall. Ambos os modelos demonstraram uma boa performance com uma accuracy que variou entre os 88% e os 98% para todos os cenários testados. Porém, foi observado que o modelo InceptionV3 é o mais bem-sucedido, obtendo na maioria dos casos os valores mais altos de accuracy apesar de se ter observado alguma variação devido a fenómenos como overfitting. Os resultados obtidos indicam que as redes neuronais podem ser ferramentas eficazes no diagnóstico de patologias mamárias a partir de imagens histológicas. A accuracy elevada dos modelos utilizados para desenvolvimento deste projeto, refletem a capacidade de reconhecer e classificar de forma precisa as características morfológicas relevantes nas imagens, demonstrando que a Inteligência Artificial tem um potencial significativo para melhorar a precisão e eficácia dos diagnósticos em Anatomia Patológica.
publishDate 2023
dc.date.none.fl_str_mv 2023-12-20T12:04:10Z
2023-11-28
2023-11-28T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.22/24328
urn:tid:203435877
url http://hdl.handle.net/10400.22/24328
identifier_str_mv urn:tid:203435877
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833600523204296704