Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse.

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: VIEIRA, Vinícius Jefferson Dias.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/27138
Resumo: Nesta Tese, são estudados os efeitos das variações acústicas não estacionárias provocadas por estados emocionais e condições de estresse em sinais de voz. Ainda não há na literatura um atributo acústico puro para reconhecimento de emoções e estresse. Por meio do índice de não estacionariedade (Index of Non-Stationarity – INS), é observado que diferentes estados afetivos apresentam diferentes graus de não estacionariedade. Como forma de detectar tais variações, é empregada a decomposição empírica de modos (Empirical Mode Decomposition – EMD), que é uma técnica não linear adequada para sinais não estacionários. Com isso, a principal contribuição deste trabalho é a proposta do vetor HHHC (Hilbert-Huang-Hurst Coefficients) como um novo atributo acústico não linear para classificação multiestilo de estados emocionais e condições de estresse. O HHHC é um atributo da fonte de excitação que é baseado em decomposição adaptativa (EMD que enfatiza as variações acústicas afetivas) e estimação dos coeficientes de Hurst (que estão relacionados com a fonte de excitação glotal) em cada um dos modos da decomposição. Outra contribuição é a utilização do INS como informação adicional ao vetor HHHC (HHHC+INS). Para comprovar a robustez do atributo proposto em diferentes línguas e contextos de fala, são analisadas cinco bases de dados, sendo quatro delas no contexto de emoções e uma no contexto de condições de estresse. Como atributos acústicos comparativos ao HHHC, são utilizados o vetor de coeficientes de Hurst (pH), os coeficientes mel-cepstrais (Mel-Frequency Cepstral Coefficients – MFCC) e o atributo baseado no operador TEO (Teager-Energy-Operator). Outra importante contribuição desta Tese é a proposta dos modelos de misturas Gaussianas com integração α (α-integrated Gaussian Mixture Models – α- GMM) para representação e classificação dos estados afetivos. Seu desempenho é comparado com os seguintes métodos clássicos: Modelos de misturas Gaussianas (GMM), Modelos de Markov escondidos (Hidden Markov Models – HMM) e Máquinas de vetor de suporte (Support Vector Machines – SVM). Os resultados obtidos demonstram que o atributo proposto HHHC e sua fusão com o INS promovem taxas de acerto significativas em relação aos atributos comparativos. Além disso, o classificador α-GMM apresenta performance superior às técnicas comparativas em todos os cenários de bases acústicas.