Identificação de patologias em pregas vocais por meio de classificador bag of features e redes neurais convolucionais

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Salvador Junior, José Narcisio
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/215729
Resumo: Patologias de laringe, como cistos e nódulos, são caracterizadas como alterações benignas e têm seu diagnóstico dado por meio de análise visual e perceptivo-auditiva em telelaringoscopias, exame endoscópico ambulatorial para inspeções laríngeas auxiliadas por vídeo. Porém, uma inspeção visual incorreta, que ocorre por similaridade vocal, acústica e também em suas propriedades anatômicas, pode levar o diagnóstico de uma das patologias benignas a prejudicar o diagnóstico de outra. Visto que há possibilidade de inversão na determinação diagnóstica entre essas duas patologias, pela equipe médica responsável, propõe-se uma ferramenta para auxílio diagnóstico que visa identificar e classificar imagens de pregas vocais saudáveis e não saudáveis - nódulos e cistos - advindas de telelaringoscopias e demais bancos de imagens, utilizando classificador inteligente Bag of Features e Redes Neurais Convolucionais - AlexNet, ResNet e DenseNet. Foi realizada segmentação de 45 imagens e aplicação de técnicas de Data Augmentation, passando a ter 300 imagens, divididas em três grupos entre teste e validação; sendo 100 imagens no grupo “normais”, 100 imagens no grupo “cistos” e 100 imagens no grupo “nódulos”. Ambos os grupos foram submetidos a 5 testes com 19 épocas cada um em todas as ferramentas utilizadas e alcançou-se o melhor resultados na CNN ResNet com acurácia de 97,33% de robustez e erro válido de 2,67% nos testes e classificação de pregas vocais saudáveis - normais e não saudáveis cistos e nódulos.