Subconjuntos gaussianos em sistemas de reconhecimento de emoções em sinais de voz

Kingeski, Rafael

Subconjuntos gaussianos em sistemas de reconhecimento de emoções em sinais de voz

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	Kingeski, Rafael
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Não Informado pela instituição
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Voz Emoções Reconhecimento de Emoções Seleção de parâmetros PCA ICA
Link de acesso:	https://repositorio.udesc.br/handle/UDESC/20346
Resumo:	Os sistemas de reconhecimento de emoções a partir da voz têm como objetivo identificar e interpretar as emoções expressas por meio de características acústicas da fala. Essa tecnologia é fundamental para aprimorar a interação entre humanos e máquinas, com aplicações em áreas como saúde, onde pode auxiliar no monitoramento emocional, e em sistemas de assistência inteligente, melhorando a resposta e a adaptação dos sistemas às necessidades dos usuários. Este estudo propõe um método de reconhecimento de emoções em sinais de voz que considera a distribuição dos parâmetros. Ao isolar subconjuntos de parâmetros com distribuição gaussiana, busca-se verificar a influência da distribuição de parâmetros de voz aplicada em técnicas de redução por transformação. Uma metodologia em múltiplas etapas é aplicada, com filtragem inicial baseada em variância, seguida do uso do teste de Kruskal-Wallis para remover dados que não contribuem para a classificação e, por fim, teste de Anderson-Darling para gerar um subconjunto conforme a distribuição. Parâmetros com distribuição normal são reduzidos pela Análise de Componentes Principais (PCA, do inglês principal component analysis), enquanto o conjunto todo de parâmetros é reduzido usando a Análise de Componentes Independentes (ICA, do inglês independent component analysis). A fusão dessas transformações foi utilizada para a classificação com Máquinas de Vetores de Suporte (SVM, do inglês support vector machine). O estudo destaca a importância da seleção de parâmetros fundamentada em teorias estatísticas, como uma alternativa simples e eficiente que dispensa o uso de abordagens automatizadas e orientadas por algoritmos iterativos que dependem de modelos. Os resultados demonstram que a segmentação em subconjuntos gaussianos, combinada com PCA e ICA, aprimora a acurácia dos sistemas de reconhecimento de emoções. Para validar o estudo, utilizaram-se três bases de dados: EMODB, RAVDESS e SAVEE. Uma melhora na acurácia foi obtida utilizando a fusão de PCA e ICA; além disso, os resultados mostram que dados que possuem distribuição gaussiana têm uma maior contribuição para o modelo.

Subconjuntos gaussianos em sistemas de reconhecimento de emoções em sinais de voz

Registros relacionados