Análise de algoritmos de machine learning para deteção de violência em áudio
Autor(a) principal: | |
---|---|
Data de Publicação: | 2023 |
Tipo de documento: | Dissertação |
Idioma: | por |
Título da fonte: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
Texto Completo: | https://hdl.handle.net/1822/86577 |
Resumo: | Dissertação de mestrado integrado em Engenharia Informática |
id |
RCAP_de1c3c51ec36043ad6bbe51a3d75e3ac |
---|---|
oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/86577 |
network_acronym_str |
RCAP |
network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository_id_str |
https://opendoar.ac.uk/repository/7160 |
spelling |
Análise de algoritmos de machine learning para deteção de violência em áudioMachine learning algorithms analysis for violence detection in audioDeteção de violênciaMachine learningDeep learningTransfer learningReconhecimento da ação humanaÁudioViolence detectionHuman action recognitionAudioEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Engenharia InformáticaA violência tem sido parte integrante da humanidade. Existem diferentes tipos de violência, sendo a violência de cariz físico mais recorrente no nosso quotidiano, afetando cada vez mais a vida de muitas pessoas. O reconhecimento da ação humana tem sido crescentemente estudada nos últimos anos. O áudio (microfones) e vídeo (câmaras) são as formas mais utilizadas na captação de violência. O reconhecimento da ação humana através do vídeo representa uma importante área na visão por computador. No entanto, a captação de vídeo requer uma grande capacidade de processamento e de desempenho, tanto de hardware como software. O áudio surge assim como um fator capaz de colmatar estes problemas. No entanto, a deteção de áudio é altamente suscetível a grandes flutuações de precisão, dependendo do ambiente acústico em que está inserido. Na presente dissertação, pretendeu-se comparar os diferentes algoritmos de Machine Learning com o intuito de averiguar qual o melhor algoritmo a utilizar para detetar violência em áudio. A revisão da literatura revelou que o áudio pode ser classificado usando algoritmos de Machine Learning, sendo a sua conversão em imagens (mel spectrogram) a metodologia habitualmente utilizada, tendo sido a abordagem tomada. Além disto, estudaram-se os algoritmos frequentemente utilizados na classificação de áudio, tendo estes sido utilizados para posterior avaliação. Os resultados obtidos demonstram um bom desempenho das redes neuronais EfficientNet, sendo que as redes que obtiveram melhor precisão foram a EfficientNetB1 e EfficientNetB0, com 95.06% e 94.19%, respetivamente. Adicionalmente, verificou-se que a rede MobileNetV2 é a mais incapaz de classificar entradas de violência, com uma classificação de 92.44%. A rede neuronal EfficientNetB1 apresentou uma melhor capacidade na classificação de violência em áudio.Violence has been an integral part of humanity. There are different types of violence, violence of a physical nature being the most recurrent in our daily lives, increasingly affecting the lives of many people. The recognition of human action has been increasingly studied in recent years. Audio (microphones) and video (cameras) are the most commonly used means of capturing violence. Recognition of human action through video represents a major area in computer vision. However, video capture requires a large processing capacity and performance of both hardware and software. Audio thus emerges as a suitable means of overcoming these problems. However, audio detection is highly susceptible to large fluctuations in accuracy, according to the acoustic environment in which it is set. Thus, a good audio representation is critical to perform audio-based classification. In this dissertation, it was intended to compare different Machine Learning algorithms to find the best algorithm to be used when detecting violence in audio. The literature review revealed that audio can be classified using Machine Learning algorithms, being its conversion into images (mel spectrogram) the most commonly used methodology, and therefore this approach was adopted. In addition to this, algorithms frequently used in audio classification were studied, and were used for further analysis. The results showed a good performance of the EfficientNet neural networks, where the networks that achieved the best accuracy were EfficientNetB1 and EfficientNetB0, with 95.06% and 94.19%, respectively. Additionally, it was observed that the MobileNetV2 network is the most unable to classify violence entries, with a classification of 92.44%. The EfficientNetB1 neural network performed better in classifying violence in audio.Novais, PauloDurães, DalilaUniversidade do MinhoVeloso, Bruno Cruz2023-04-122023-04-12T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/86577por203356705info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T05:33:23Zoai:repositorium.sdum.uminho.pt:1822/86577Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T15:22:16.434090Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
dc.title.none.fl_str_mv |
Análise de algoritmos de machine learning para deteção de violência em áudio Machine learning algorithms analysis for violence detection in audio |
title |
Análise de algoritmos de machine learning para deteção de violência em áudio |
spellingShingle |
Análise de algoritmos de machine learning para deteção de violência em áudio Veloso, Bruno Cruz Deteção de violência Machine learning Deep learning Transfer learning Reconhecimento da ação humana Áudio Violence detection Human action recognition Audio Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
title_short |
Análise de algoritmos de machine learning para deteção de violência em áudio |
title_full |
Análise de algoritmos de machine learning para deteção de violência em áudio |
title_fullStr |
Análise de algoritmos de machine learning para deteção de violência em áudio |
title_full_unstemmed |
Análise de algoritmos de machine learning para deteção de violência em áudio |
title_sort |
Análise de algoritmos de machine learning para deteção de violência em áudio |
author |
Veloso, Bruno Cruz |
author_facet |
Veloso, Bruno Cruz |
author_role |
author |
dc.contributor.none.fl_str_mv |
Novais, Paulo Durães, Dalila Universidade do Minho |
dc.contributor.author.fl_str_mv |
Veloso, Bruno Cruz |
dc.subject.por.fl_str_mv |
Deteção de violência Machine learning Deep learning Transfer learning Reconhecimento da ação humana Áudio Violence detection Human action recognition Audio Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
topic |
Deteção de violência Machine learning Deep learning Transfer learning Reconhecimento da ação humana Áudio Violence detection Human action recognition Audio Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática |
description |
Dissertação de mestrado integrado em Engenharia Informática |
publishDate |
2023 |
dc.date.none.fl_str_mv |
2023-04-12 2023-04-12T00:00:00Z |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/86577 |
url |
https://hdl.handle.net/1822/86577 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
203356705 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
repository.mail.fl_str_mv |
info@rcaap.pt |
_version_ |
1833595273535815680 |