Aprendizado de máquina para a classificação automática de pratos de bateria conforme a proporção de estanho presente em suas ligas de bronze
Ano de defesa: | 2022 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Juiz de Fora (UFJF)
|
Programa de Pós-Graduação: |
Programa de Pós-graduação em Modelagem Computacional
|
Departamento: |
Faculdade de Engenharia
|
País: |
Brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://doi.org/10.34019/ufjf/di/2022/00396 https://repositorio.ufjf.br/jspui/handle/ufjf/15052 |
Resumo: | Os diversos fatores que influenciam no som de um prato de bateria, combinados com os aspectos externos que modificam a sua percepção sonora, tornam o estudo da acústica destes instrumentos mais desafiadora. Pesquisas que focam no estudo de pratos de bateria são encontradas na literatura com diversas abordagens e métodos de investigação. Entretanto, ao considerar o contexto de aprendizado de máquina, a aplicação deste tipo de técnica para o estudo de pratos de bateria ainda é pouco explorada e, normalmente, foca na identificação das categorias de pratos e o modo como foram tocados. Dessa forma, o uso de ferramentas computacionais baseadas na aprendizagem de máquina para investigar os elementos acústicos destes instrumentos torna-se um tópico de estudo com potencial para ser desenvolvido. Inspirado nisso, este trabalho propõe a classificação de pratos de bateria conforme seus materiais constituintes, uma vez que a liga metálica assume uma parcela de responsabilidade significativa em sua acústica. Para tanto, um procedimento para a captura padronizada dos sons destes instrumentos foi desenvolvido e possibilitou construir uma base de dados composta por 276 áudios, referente a 4 pratos de bateria. Diferentes conjuntos de atributos, técnicas de seleção e classificadores foram avaliados, com a finalidade de propor um modelo computacional eficiente para a resolver tal problema. Como resultado, uma acurácia média de 99, 75% foi alcançada ao aplicar a regressão logística em um subconjunto de 30 atributos formados por 17 características temporais e 13 Coeficientes Mel-Cepstrais de Frequência (MFCC), selecionados por uma técnica baseada na análise do limiar de correlação entre as variáveis. Por outro lado, ao priorizar a dimensionalidade do subconjunto selecionado, a utilização de uma técnica de seleção baseada na regressão LASSO, seguida da análise de correlação, proporciona identificar um subconjunto de 5 atributos que promovem uma acurácia média de 99, 37%, também utilizando a regressão logística como classificador. |