Export Ready — 

Análise de algoritmos de machine learning para deteção de violência em áudio

Bibliographic Details
Main Author: Veloso, Bruno Cruz
Publication Date: 2023
Format: Master thesis
Language: por
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: https://hdl.handle.net/1822/86577
Summary: Dissertação de mestrado integrado em Engenharia Informática
id RCAP_de1c3c51ec36043ad6bbe51a3d75e3ac
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/86577
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Análise de algoritmos de machine learning para deteção de violência em áudioMachine learning algorithms analysis for violence detection in audioDeteção de violênciaMachine learningDeep learningTransfer learningReconhecimento da ação humanaÁudioViolence detectionHuman action recognitionAudioEngenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e InformáticaDissertação de mestrado integrado em Engenharia InformáticaA violência tem sido parte integrante da humanidade. Existem diferentes tipos de violência, sendo a violência de cariz físico mais recorrente no nosso quotidiano, afetando cada vez mais a vida de muitas pessoas. O reconhecimento da ação humana tem sido crescentemente estudada nos últimos anos. O áudio (microfones) e vídeo (câmaras) são as formas mais utilizadas na captação de violência. O reconhecimento da ação humana através do vídeo representa uma importante área na visão por computador. No entanto, a captação de vídeo requer uma grande capacidade de processamento e de desempenho, tanto de hardware como software. O áudio surge assim como um fator capaz de colmatar estes problemas. No entanto, a deteção de áudio é altamente suscetível a grandes flutuações de precisão, dependendo do ambiente acústico em que está inserido. Na presente dissertação, pretendeu-se comparar os diferentes algoritmos de Machine Learning com o intuito de averiguar qual o melhor algoritmo a utilizar para detetar violência em áudio. A revisão da literatura revelou que o áudio pode ser classificado usando algoritmos de Machine Learning, sendo a sua conversão em imagens (mel spectrogram) a metodologia habitualmente utilizada, tendo sido a abordagem tomada. Além disto, estudaram-se os algoritmos frequentemente utilizados na classificação de áudio, tendo estes sido utilizados para posterior avaliação. Os resultados obtidos demonstram um bom desempenho das redes neuronais EfficientNet, sendo que as redes que obtiveram melhor precisão foram a EfficientNetB1 e EfficientNetB0, com 95.06% e 94.19%, respetivamente. Adicionalmente, verificou-se que a rede MobileNetV2 é a mais incapaz de classificar entradas de violência, com uma classificação de 92.44%. A rede neuronal EfficientNetB1 apresentou uma melhor capacidade na classificação de violência em áudio.Violence has been an integral part of humanity. There are different types of violence, violence of a physical nature being the most recurrent in our daily lives, increasingly affecting the lives of many people. The recognition of human action has been increasingly studied in recent years. Audio (microphones) and video (cameras) are the most commonly used means of capturing violence. Recognition of human action through video represents a major area in computer vision. However, video capture requires a large processing capacity and performance of both hardware and software. Audio thus emerges as a suitable means of overcoming these problems. However, audio detection is highly susceptible to large fluctuations in accuracy, according to the acoustic environment in which it is set. Thus, a good audio representation is critical to perform audio-based classification. In this dissertation, it was intended to compare different Machine Learning algorithms to find the best algorithm to be used when detecting violence in audio. The literature review revealed that audio can be classified using Machine Learning algorithms, being its conversion into images (mel spectrogram) the most commonly used methodology, and therefore this approach was adopted. In addition to this, algorithms frequently used in audio classification were studied, and were used for further analysis. The results showed a good performance of the EfficientNet neural networks, where the networks that achieved the best accuracy were EfficientNetB1 and EfficientNetB0, with 95.06% and 94.19%, respectively. Additionally, it was observed that the MobileNetV2 network is the most unable to classify violence entries, with a classification of 92.44%. The EfficientNetB1 neural network performed better in classifying violence in audio.Novais, PauloDurães, DalilaUniversidade do MinhoVeloso, Bruno Cruz2023-04-122023-04-12T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/86577por203356705info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T05:33:23Zoai:repositorium.sdum.uminho.pt:1822/86577Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T15:22:16.434090Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Análise de algoritmos de machine learning para deteção de violência em áudio
Machine learning algorithms analysis for violence detection in audio
title Análise de algoritmos de machine learning para deteção de violência em áudio
spellingShingle Análise de algoritmos de machine learning para deteção de violência em áudio
Veloso, Bruno Cruz
Deteção de violência
Machine learning
Deep learning
Transfer learning
Reconhecimento da ação humana
Áudio
Violence detection
Human action recognition
Audio
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
title_short Análise de algoritmos de machine learning para deteção de violência em áudio
title_full Análise de algoritmos de machine learning para deteção de violência em áudio
title_fullStr Análise de algoritmos de machine learning para deteção de violência em áudio
title_full_unstemmed Análise de algoritmos de machine learning para deteção de violência em áudio
title_sort Análise de algoritmos de machine learning para deteção de violência em áudio
author Veloso, Bruno Cruz
author_facet Veloso, Bruno Cruz
author_role author
dc.contributor.none.fl_str_mv Novais, Paulo
Durães, Dalila
Universidade do Minho
dc.contributor.author.fl_str_mv Veloso, Bruno Cruz
dc.subject.por.fl_str_mv Deteção de violência
Machine learning
Deep learning
Transfer learning
Reconhecimento da ação humana
Áudio
Violence detection
Human action recognition
Audio
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
topic Deteção de violência
Machine learning
Deep learning
Transfer learning
Reconhecimento da ação humana
Áudio
Violence detection
Human action recognition
Audio
Engenharia e Tecnologia::Engenharia Eletrotécnica, Eletrónica e Informática
description Dissertação de mestrado integrado em Engenharia Informática
publishDate 2023
dc.date.none.fl_str_mv 2023-04-12
2023-04-12T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/86577
url https://hdl.handle.net/1822/86577
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv 203356705
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833595273535815680