Modelos geradores para detecções de anomalias em atividades sonoras
Ano de defesa: | 2023 |
---|---|
Autor(a) principal: | |
Outros Autores: | , |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal do Amazonas
Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://tede.ufam.edu.br/handle/tede/9736 |
Resumo: | Diversos domínios de dados possibilitam a utilização de detecção de anomalias, dentre eles o áudio. Uma funcionalidade importante destes sistemas é identificar quando algo está fora da normalidade. Para isso, diversos estudos utilizando aprendizagem de máquina foram realizados. Os estado-da-arte na identificação de anomalias em imagens utilizam arquiteturas baseadas em GAN (Generative Adversarial Network), entretanto, poucos estudos demonstram a utilização destas ou outras arquiteturas geradoras no domínio de sons. Para lidar com esse problema, este trabalho propõe o desenvolvimento de um método de identificação de anomalias em atividades sonoras utilizando dados capturados através de microfones. O processo de identificação de anomalia é realizado por meio de um modelo gerador a partir de uma arquitetura de rede profunda. Testes utilizando bases de dados reais mostram que algumas alterações nas arquiteturas utilizadas para imagens podem obter resultados promissores. Validamos nossa abordagem no conjunto de dados DCASE 2021, que inclui mais de 180 horas de maquinário industrial. Avaliamos a classificação das anomalias, relatando uma média ponderada de 88,16% de AUC e 78,05% de pAUC, resultados superiores ao apresentado por baselines. |