Reconhecimento de emoções baseado em Aprendizado Autossupervisionado

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Utyiama, Daniel Mitsuaki da Silva
Outros Autores: http://lattes.cnpq.br/7029717519311438
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
.
Link de acesso: https://tede.ufam.edu.br/handle/tede/10368
Resumo: O reconhecimento de emoções é uma aplicação do aprendizado de máquina que envolve a análise de sinais fisiológicos, de áudio e/ou vídeo para identificar emoções expressas pelos indivíduos. A obtenção de bases de dados rotuladas para essa tarefa é desafiadora e onerosa, muitas vezes apresentando problemas estruturais como desequilíbrio de classes, dados faltantes e vieses de rotulagem. Uma abordagem promissora para contornar esses problemas é desenvolver soluções de reconhecimento de padrões baseadas no aprendizado autossupervisionado. Essa abordagem permite treinar modelos utilizando dados não rotulados, transferindo o conhecimento adquirido para um modelo especializado no reconhecimento de emoções. Dessa forma, é possível superar a dependência de bases de dados rotuladas, tornando o processo mais eficiente e menos custoso. A escolha de tarefas auxiliares no aprendizado autossupervisionado é crucial, pois possibilita o treinamento eficiente de modelos em grandes bases de dados não rotulados e contribui para a aprendizagem de representações robustas e generalizáveis. Isso permite que o modelo se adapte melhor a diferentes tarefas e cenários. Nesse contexto, este trabalho apresenta uma arquitetura de rede neural que utiliza uma abordagem auto-supervisionada para o reconhecimento de emoções a partir de sinais de eletrocardiograma. Para avaliar o desempenho da arquitetura neural proposta, implementamos e avaliamos diferentes combinações de tarefas auxiliares, analisando como cada uma contribui para a eficácia e precisão do modelo. Identificamos as tarefas auxiliares mais significativas para a classificação de emoções e realizamos análises detalhadas dos parâmetros associados a essas tarefas. Experimentos conduzidos em quatro bases de dados públicas demonstraram consistentemente o desempenho superior do método proposto em comparação com a mesma arquitetura treinada de forma supervisionada. Na base de dados SWELL, o método alcançou uma acurácia de 93,64% na classificação de excitação, que é uma dimensão da emoção, utilizando apenas 25% dos dados rotulados, comparado a 78,20% do método supervisionado.