Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse.

VIEIRA, Vinícius Jefferson Dias.

Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse.

Detalhes bibliográficos
Ano de defesa:	2018
Autor(a) principal:	VIEIRA, Vinícius Jefferson Dias.
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Campina Grande Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA UFCG
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Atributo acústico Decomposição empírica de modos Índice de não estacionariedade Reconhecimento de emoções Acoustic attribute Empirical decomposition of modes Index of no stationarity Emotion recognition Engenharia Elétrica
Link de acesso:	http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/27138
Resumo:	Nesta Tese, são estudados os efeitos das variações acústicas não estacionárias provocadas por estados emocionais e condições de estresse em sinais de voz. Ainda não há na literatura um atributo acústico puro para reconhecimento de emoções e estresse. Por meio do índice de não estacionariedade (Index of Non-Stationarity – INS), é observado que diferentes estados afetivos apresentam diferentes graus de não estacionariedade. Como forma de detectar tais variações, é empregada a decomposição empírica de modos (Empirical Mode Decomposition – EMD), que é uma técnica não linear adequada para sinais não estacionários. Com isso, a principal contribuição deste trabalho é a proposta do vetor HHHC (Hilbert-Huang-Hurst Coefficients) como um novo atributo acústico não linear para classificação multiestilo de estados emocionais e condições de estresse. O HHHC é um atributo da fonte de excitação que é baseado em decomposição adaptativa (EMD que enfatiza as variações acústicas afetivas) e estimação dos coeficientes de Hurst (que estão relacionados com a fonte de excitação glotal) em cada um dos modos da decomposição. Outra contribuição é a utilização do INS como informação adicional ao vetor HHHC (HHHC+INS). Para comprovar a robustez do atributo proposto em diferentes línguas e contextos de fala, são analisadas cinco bases de dados, sendo quatro delas no contexto de emoções e uma no contexto de condições de estresse. Como atributos acústicos comparativos ao HHHC, são utilizados o vetor de coeficientes de Hurst (pH), os coeficientes mel-cepstrais (Mel-Frequency Cepstral Coefficients – MFCC) e o atributo baseado no operador TEO (Teager-Energy-Operator). Outra importante contribuição desta Tese é a proposta dos modelos de misturas Gaussianas com integração α (α-integrated Gaussian Mixture Models – α- GMM) para representação e classificação dos estados afetivos. Seu desempenho é comparado com os seguintes métodos clássicos: Modelos de misturas Gaussianas (GMM), Modelos de Markov escondidos (Hidden Markov Models – HMM) e Máquinas de vetor de suporte (Support Vector Machines – SVM). Os resultados obtidos demonstram que o atributo proposto HHHC e sua fusão com o INS promovem taxas de acerto significativas em relação aos atributos comparativos. Além disso, o classificador α-GMM apresenta performance superior às técnicas comparativas em todos os cenários de bases acústicas.

Análise de variações acústicas não estacionárias e seu efeito na detecção de múltiplas emoções e condições de estresse.

Registros relacionados