Reconhecimento de emoções baseado em Aprendizado Autossupervisionado
Ano de defesa: | 2024 |
---|---|
Autor(a) principal: | |
Outros Autores: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal do Amazonas
Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://tede.ufam.edu.br/handle/tede/10368 |
Resumo: | O reconhecimento de emoções é uma aplicação do aprendizado de máquina que envolve a análise de sinais fisiológicos, de áudio e/ou vídeo para identificar emoções expressas pelos indivíduos. A obtenção de bases de dados rotuladas para essa tarefa é desafiadora e onerosa, muitas vezes apresentando problemas estruturais como desequilíbrio de classes, dados faltantes e vieses de rotulagem. Uma abordagem promissora para contornar esses problemas é desenvolver soluções de reconhecimento de padrões baseadas no aprendizado autossupervisionado. Essa abordagem permite treinar modelos utilizando dados não rotulados, transferindo o conhecimento adquirido para um modelo especializado no reconhecimento de emoções. Dessa forma, é possível superar a dependência de bases de dados rotuladas, tornando o processo mais eficiente e menos custoso. A escolha de tarefas auxiliares no aprendizado autossupervisionado é crucial, pois possibilita o treinamento eficiente de modelos em grandes bases de dados não rotulados e contribui para a aprendizagem de representações robustas e generalizáveis. Isso permite que o modelo se adapte melhor a diferentes tarefas e cenários. Nesse contexto, este trabalho apresenta uma arquitetura de rede neural que utiliza uma abordagem auto-supervisionada para o reconhecimento de emoções a partir de sinais de eletrocardiograma. Para avaliar o desempenho da arquitetura neural proposta, implementamos e avaliamos diferentes combinações de tarefas auxiliares, analisando como cada uma contribui para a eficácia e precisão do modelo. Identificamos as tarefas auxiliares mais significativas para a classificação de emoções e realizamos análises detalhadas dos parâmetros associados a essas tarefas. Experimentos conduzidos em quatro bases de dados públicas demonstraram consistentemente o desempenho superior do método proposto em comparação com a mesma arquitetura treinada de forma supervisionada. Na base de dados SWELL, o método alcançou uma acurácia de 93,64% na classificação de excitação, que é uma dimensão da emoção, utilizando apenas 25% dos dados rotulados, comparado a 78,20% do método supervisionado. |