Análise dinâmica não linear de sinais de voz para detecção de patologias laríngeas.
Ano de defesa: | 2012 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/1416 |
Resumo: | Patologias na laringe podem afetar a qualidade vocal, prejudicando a comunicação humana. As técnicas objetivas tradicionais para o diagnóstico dessas patologias fazem uso de exames considerados invasivos, causando certo desconforto ao paciente. Análise acústica, utilizando técnicas de processamento digital de sinais de voz, pode ser utilizada para o desenvolvimento de ferramentas não invasivas de auxílio ao diagnóstico de patologias laríngeas. A precisão do diagnóstico, contudo, depende da escolha das características e parâmetros da fala que melhor representem a desordem vocal provocada por uma determinada patologia. Este trabalho trata da caracterização e da classificação de sinais de vozes saudáveis e vozes afetadas por diferentes patologias laríngeas (edema, paralisia e nódulos nas pregas vocais), por meio da análise dinâmica não linear (e teoria do caos), como também por meio da análise de quantificação de recorrência. No processo de caracterização é investigado, por meio de testes estatísticos, o potencial de cada característica em discriminar os tipos de sinais de voz considerados. Para a classificação é empregada a técnica de análise discriminante com as funções linear ou quadrática, com validação cruzada, sendo considerado um intervalo de confiança de 95% para as médias das taxas de acuraria do classificador. A partir da combinação de características dos conjuntos das medidas de análise não linear (MNL) e das medidas de quantificação de recorrência (MQR), as médias da taxa de acurácia obtidas variaram nos intervalos de confiança: [95,44%; 100%) para a classificação entre vozes saudáveis e patológicas; [94,75%; 100%] entre vozes saudáveis e afetadas por edema, e entre saudáveis e nódulos. Para a classificação entre saudável e paralisia, obteve-se uma acurácia de 100% . Também são avaliados os efeitos do uso de vetores híbridos formados por características MNL, MQR e coeficientes extraídos da análise preditiva linear (LPC). Neste caso. as taxas de acurácia variaram nos intervalos de confiança: [95,02%; 97,62%] na discriminação entre vozes afetadas por paralisia e edema; [98,29%; 99,93%] para paralisia versus nódulos e [97,98%; 99,84%] para edema versus nódulos. Os resultados encontrados indicam que o método utilizado é promissor, podendo ser empregado no desenvolvimento de uma ferramenta computacional para apoio ao diagnóstico de patologias laríngeas. |