Detalhes bibliográficos
| Ano de defesa: |
2024 |
| Autor(a) principal: |
Kingeski, Rafael |
| Orientador(a): |
Não Informado pela instituição |
| Banca de defesa: |
Não Informado pela instituição |
| Tipo de documento: |
Tese
|
| Tipo de acesso: |
Acesso aberto |
| Idioma: |
por |
| Instituição de defesa: |
Não Informado pela instituição
|
| Programa de Pós-Graduação: |
Não Informado pela instituição
|
| Departamento: |
Não Informado pela instituição
|
| País: |
Não Informado pela instituição
|
| Palavras-chave em Português: |
|
| Link de acesso: |
https://repositorio.udesc.br/handle/UDESC/20346
|
Resumo: |
Os sistemas de reconhecimento de emoções a partir da voz têm como objetivo identificar e interpretar as emoções expressas por meio de características acústicas da fala. Essa tecnologia é fundamental para aprimorar a interação entre humanos e máquinas, com aplicações em áreas como saúde, onde pode auxiliar no monitoramento emocional, e em sistemas de assistência inteligente, melhorando a resposta e a adaptação dos sistemas às necessidades dos usuários. Este estudo propõe um método de reconhecimento de emoções em sinais de voz que considera a distribuição dos parâmetros. Ao isolar subconjuntos de parâmetros com distribuição gaussiana, busca-se verificar a influência da distribuição de parâmetros de voz aplicada em técnicas de redução por transformação. Uma metodologia em múltiplas etapas é aplicada, com filtragem inicial baseada em variância, seguida do uso do teste de Kruskal-Wallis para remover dados que não contribuem para a classificação e, por fim, teste de Anderson-Darling para gerar um subconjunto conforme a distribuição. Parâmetros com distribuição normal são reduzidos pela Análise de Componentes Principais (PCA, do inglês principal component analysis), enquanto o conjunto todo de parâmetros é reduzido usando a Análise de Componentes Independentes (ICA, do inglês independent component analysis). A fusão dessas transformações foi utilizada para a classificação com Máquinas de Vetores de Suporte (SVM, do inglês support vector machine). O estudo destaca a importância da seleção de parâmetros fundamentada em teorias estatísticas, como uma alternativa simples e eficiente que dispensa o uso de abordagens automatizadas e orientadas por algoritmos iterativos que dependem de modelos. Os resultados demonstram que a segmentação em subconjuntos gaussianos, combinada com PCA e ICA, aprimora a acurácia dos sistemas de reconhecimento de emoções. Para validar o estudo, utilizaram-se três bases de dados: EMODB, RAVDESS e SAVEE. Uma melhora na acurácia foi obtida utilizando a fusão de PCA e ICA; além disso, os resultados mostram que dados que possuem distribuição gaussiana têm uma maior contribuição para o modelo. |