Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse.
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/27138 |
Resumo: | Nesta Tese, são estudados os efeitos das variações acústicas não estacionárias provocadas por estados emocionais e condições de estresse em sinais de voz. Ainda não há na literatura um atributo acústico puro para reconhecimento de emoções e estresse. Por meio do índice de não estacionariedade (Index of Non-Stationarity – INS), é observado que diferentes estados afetivos apresentam diferentes graus de não estacionariedade. Como forma de detectar tais variações, é empregada a decomposição empírica de modos (Empirical Mode Decomposition – EMD), que é uma técnica não linear adequada para sinais não estacionários. Com isso, a principal contribuição deste trabalho é a proposta do vetor HHHC (Hilbert-Huang-Hurst Coefficients) como um novo atributo acústico não linear para classificação multiestilo de estados emocionais e condições de estresse. O HHHC é um atributo da fonte de excitação que é baseado em decomposição adaptativa (EMD que enfatiza as variações acústicas afetivas) e estimação dos coeficientes de Hurst (que estão relacionados com a fonte de excitação glotal) em cada um dos modos da decomposição. Outra contribuição é a utilização do INS como informação adicional ao vetor HHHC (HHHC+INS). Para comprovar a robustez do atributo proposto em diferentes línguas e contextos de fala, são analisadas cinco bases de dados, sendo quatro delas no contexto de emoções e uma no contexto de condições de estresse. Como atributos acústicos comparativos ao HHHC, são utilizados o vetor de coeficientes de Hurst (pH), os coeficientes mel-cepstrais (Mel-Frequency Cepstral Coefficients – MFCC) e o atributo baseado no operador TEO (Teager-Energy-Operator). Outra importante contribuição desta Tese é a proposta dos modelos de misturas Gaussianas com integração α (α-integrated Gaussian Mixture Models – α- GMM) para representação e classificação dos estados afetivos. Seu desempenho é comparado com os seguintes métodos clássicos: Modelos de misturas Gaussianas (GMM), Modelos de Markov escondidos (Hidden Markov Models – HMM) e Máquinas de vetor de suporte (Support Vector Machines – SVM). Os resultados obtidos demonstram que o atributo proposto HHHC e sua fusão com o INS promovem taxas de acerto significativas em relação aos atributos comparativos. Além disso, o classificador α-GMM apresenta performance superior às técnicas comparativas em todos os cenários de bases acústicas. |