Modelos geradores para detecções de anomalias em atividades sonoras

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Oliveira Neto, Wilson Araújo de
Outros Autores: http://lattes.cnpq.br/7021584208943977, https://orcid.org/0000-0001-9027-3966
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://tede.ufam.edu.br/handle/tede/9736
Resumo: Diversos domínios de dados possibilitam a utilização de detecção de anomalias, dentre eles o áudio. Uma funcionalidade importante destes sistemas é identificar quando algo está fora da normalidade. Para isso, diversos estudos utilizando aprendizagem de máquina foram realizados. Os estado-da-arte na identificação de anomalias em imagens utilizam arquiteturas baseadas em GAN (Generative Adversarial Network), entretanto, poucos estudos demonstram a utilização destas ou outras arquiteturas geradoras no domínio de sons. Para lidar com esse problema, este trabalho propõe o desenvolvimento de um método de identificação de anomalias em atividades sonoras utilizando dados capturados através de microfones. O processo de identificação de anomalia é realizado por meio de um modelo gerador a partir de uma arquitetura de rede profunda. Testes utilizando bases de dados reais mostram que algumas alterações nas arquiteturas utilizadas para imagens podem obter resultados promissores. Validamos nossa abordagem no conjunto de dados DCASE 2021, que inclui mais de 180 horas de maquinário industrial. Avaliamos a classificação das anomalias, relatando uma média ponderada de 88,16% de AUC e 78,05% de pAUC, resultados superiores ao apresentado por baselines.