Subconjuntos gaussianos em sistemas de reconhecimento de emoções em sinais de voz

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Kingeski, Rafael
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Voz
PCA
ICA
Link de acesso: https://repositorio.udesc.br/handle/UDESC/20346
Resumo: Os sistemas de reconhecimento de emoções a partir da voz têm como objetivo identificar e interpretar as emoções expressas por meio de características acústicas da fala. Essa tecnologia é fundamental para aprimorar a interação entre humanos e máquinas, com aplicações em áreas como saúde, onde pode auxiliar no monitoramento emocional, e em sistemas de assistência inteligente, melhorando a resposta e a adaptação dos sistemas às necessidades dos usuários. Este estudo propõe um método de reconhecimento de emoções em sinais de voz que considera a distribuição dos parâmetros. Ao isolar subconjuntos de parâmetros com distribuição gaussiana, busca-se verificar a influência da distribuição de parâmetros de voz aplicada em técnicas de redução por transformação. Uma metodologia em múltiplas etapas é aplicada, com filtragem inicial baseada em variância, seguida do uso do teste de Kruskal-Wallis para remover dados que não contribuem para a classificação e, por fim, teste de Anderson-Darling para gerar um subconjunto conforme a distribuição. Parâmetros com distribuição normal são reduzidos pela Análise de Componentes Principais (PCA, do inglês principal component analysis), enquanto o conjunto todo de parâmetros é reduzido usando a Análise de Componentes Independentes (ICA, do inglês independent component analysis). A fusão dessas transformações foi utilizada para a classificação com Máquinas de Vetores de Suporte (SVM, do inglês support vector machine). O estudo destaca a importância da seleção de parâmetros fundamentada em teorias estatísticas, como uma alternativa simples e eficiente que dispensa o uso de abordagens automatizadas e orientadas por algoritmos iterativos que dependem de modelos. Os resultados demonstram que a segmentação em subconjuntos gaussianos, combinada com PCA e ICA, aprimora a acurácia dos sistemas de reconhecimento de emoções. Para validar o estudo, utilizaram-se três bases de dados: EMODB, RAVDESS e SAVEE. Uma melhora na acurácia foi obtida utilizando a fusão de PCA e ICA; além disso, os resultados mostram que dados que possuem distribuição gaussiana têm uma maior contribuição para o modelo.