Export Ready — 

Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias

Bibliographic Details
Main Author: LIRA, Maira Farias de Andrade
Publication Date: 2024
Format: Master thesis
Language: por
Source: Repositório Institucional da UFPE
Download full: https://repositorio.ufpe.br/handle/123456789/57246
Summary: Técnicas de detecção de anomalias são amplamente utilizadas para identificar instâncias com padrões distintos do comportamento geral de um conjunto de dados. O desenvolvimento de novas técnicas, como as baseadas em aprendizado profundo, e a maior disponibilidade de dados têm alavancado ainda mais o uso da detecção de anomalias em contextos como a detecção de falhas em equipamentos industriais. Comumente, uma técnica de detecção gera um score de anomalia para cada instância, que é então usado para classificá-las entre anômalas ou normais. Esta classificação é baseada em um limiar de decisão (threshold) estabelecido de forma que se o score de uma determinada instância for superior ao threshold, esta instância é considerada anômala, caso contrário é classificada como normal. Neste trabalho foi utilizado um modelo Sparse Autoencoder (SAE) para a detecção de anomalias online que vem ganhando populari- dade neste cenário e foi investigado o impacto de diferentes abordagens não supervisionadas para definição de thresholds. Para os experimentos foi utilizada uma base de dados pública referente a um problema de detecção de anomalias no metrô da cidade do Porto. A aborda- gem de cálculo do threshold impactou fortemente as métricas de avaliação da detecção. Por exemplo, a abordagem baseada em erro máximo garantiu a menor taxa de falsos positivos. Por sua vez, a abordagem baseada em intervalo interquartil obteve o maior número de verdadeiros positivos, e, consequentemente recall, enquanto que a abordagem baseada em 99-percentil garantiu o maior F1-Score. Foi avaliado ainda o uso de três tipos de filtros passa-baixa em duas abordagens distintas para a suavização do score de anomalia. De uma forma geral, a aplicação de filtros diretamente sobre o score de anomalia maximizou verdadeiros positivos, enquanto sua aplicação após uma classificação prévia das instâncias minimizou os falsos posi- tivos. Além disso, foi verificado que a utilização do filtro foi essencial para detectar sequências de anomalias. Desta forma, a seleção de abordagens de definição de thresholds e de aplicação de filtros deve ser definida em função dos objetivos específicos do modelo.
id UFPE_a2b7d126774f4e6ac42b995ce193889c
oai_identifier_str oai:repositorio.ufpe.br:123456789/57246
network_acronym_str UFPE
network_name_str Repositório Institucional da UFPE
repository_id_str 2221
spelling Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomaliasInteligência computacionalDetecção de anomaliasSparse AutoencoderThresholdFiltro passa-baixaTécnicas de detecção de anomalias são amplamente utilizadas para identificar instâncias com padrões distintos do comportamento geral de um conjunto de dados. O desenvolvimento de novas técnicas, como as baseadas em aprendizado profundo, e a maior disponibilidade de dados têm alavancado ainda mais o uso da detecção de anomalias em contextos como a detecção de falhas em equipamentos industriais. Comumente, uma técnica de detecção gera um score de anomalia para cada instância, que é então usado para classificá-las entre anômalas ou normais. Esta classificação é baseada em um limiar de decisão (threshold) estabelecido de forma que se o score de uma determinada instância for superior ao threshold, esta instância é considerada anômala, caso contrário é classificada como normal. Neste trabalho foi utilizado um modelo Sparse Autoencoder (SAE) para a detecção de anomalias online que vem ganhando populari- dade neste cenário e foi investigado o impacto de diferentes abordagens não supervisionadas para definição de thresholds. Para os experimentos foi utilizada uma base de dados pública referente a um problema de detecção de anomalias no metrô da cidade do Porto. A aborda- gem de cálculo do threshold impactou fortemente as métricas de avaliação da detecção. Por exemplo, a abordagem baseada em erro máximo garantiu a menor taxa de falsos positivos. Por sua vez, a abordagem baseada em intervalo interquartil obteve o maior número de verdadeiros positivos, e, consequentemente recall, enquanto que a abordagem baseada em 99-percentil garantiu o maior F1-Score. Foi avaliado ainda o uso de três tipos de filtros passa-baixa em duas abordagens distintas para a suavização do score de anomalia. De uma forma geral, a aplicação de filtros diretamente sobre o score de anomalia maximizou verdadeiros positivos, enquanto sua aplicação após uma classificação prévia das instâncias minimizou os falsos posi- tivos. Além disso, foi verificado que a utilização do filtro foi essencial para detectar sequências de anomalias. Desta forma, a seleção de abordagens de definição de thresholds e de aplicação de filtros deve ser definida em função dos objetivos específicos do modelo.CAPESAnomaly detection techniques are widely used to identify instances with patterns differing from the general behavior of a data set. The development of new techniques, such as those based on deep learning, and the higher availability of data have increased anomaly detection use in contexts such as failure detection in industrial equipment. Frequently, a detection technique generates an anomaly score for each instance, later used to classify it as anomalous or normal. This classification is based on an established detection threshold such that if a given instance’s score is higher than the established limit, it is considered anomalous. Otherwise, it is normal. In this work, the impact of different unsupervised approaches to define a threshold was inves- tigated for anomaly detection by a Sparse Autoencoder (SAE) model. The experiments were based on a public database from an anomaly detection problem in Porto metro. The threshold calculation method strongly impacted detection evaluation metrics. For example, the maxi- mum error approach guaranteed the lowest false positive ratio. On the other hand, the inter quantile range approach yielded the highest true positive numbers and, consequently, higher recall, and the 99-percentile-based approach had the highest F1-Score. We also evaluated using three low-pass filters in two different approaches to smooth anomaly scores. Generally, filter applications directly on the anomaly score maximized true positives, while their application after a previous instance classification minimized false positives. Besides this, filter usage was essential to detect anomalous sequences. Thus, the selection of threshold definition techniques and filter application must be defined in function of the model-specific goals.Universidade Federal de PernambucoUFPEBrasilPrograma de Pos Graduacao em Ciencia da ComputacaoPRUDÊNCIO, Ricardo Bastos Cavalcantehttp://lattes.cnpq.br/9281776749365231http://lattes.cnpq.br/2984888073123287LIRA, Maira Farias de Andrade2024-08-07T13:54:06Z2024-08-07T13:54:06Z2024-01-25info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfLIRA, Maira Farias de Andrade. Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024.https://repositorio.ufpe.br/handle/123456789/57246porAttribution-NonCommercial-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nc-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Repositório Institucional da UFPEinstname:Universidade Federal de Pernambuco (UFPE)instacron:UFPE2024-08-08T05:33:12Zoai:repositorio.ufpe.br:123456789/57246Repositório InstitucionalPUBhttps://repositorio.ufpe.br/oai/requestattena@ufpe.bropendoar:22212024-08-08T05:33:12Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)false
dc.title.none.fl_str_mv Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
title Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
spellingShingle Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
LIRA, Maira Farias de Andrade
Inteligência computacional
Detecção de anomalias
Sparse Autoencoder
Threshold
Filtro passa-baixa
title_short Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
title_full Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
title_fullStr Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
title_full_unstemmed Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
title_sort Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias
author LIRA, Maira Farias de Andrade
author_facet LIRA, Maira Farias de Andrade
author_role author
dc.contributor.none.fl_str_mv PRUDÊNCIO, Ricardo Bastos Cavalcante
http://lattes.cnpq.br/9281776749365231
http://lattes.cnpq.br/2984888073123287
dc.contributor.author.fl_str_mv LIRA, Maira Farias de Andrade
dc.subject.por.fl_str_mv Inteligência computacional
Detecção de anomalias
Sparse Autoencoder
Threshold
Filtro passa-baixa
topic Inteligência computacional
Detecção de anomalias
Sparse Autoencoder
Threshold
Filtro passa-baixa
description Técnicas de detecção de anomalias são amplamente utilizadas para identificar instâncias com padrões distintos do comportamento geral de um conjunto de dados. O desenvolvimento de novas técnicas, como as baseadas em aprendizado profundo, e a maior disponibilidade de dados têm alavancado ainda mais o uso da detecção de anomalias em contextos como a detecção de falhas em equipamentos industriais. Comumente, uma técnica de detecção gera um score de anomalia para cada instância, que é então usado para classificá-las entre anômalas ou normais. Esta classificação é baseada em um limiar de decisão (threshold) estabelecido de forma que se o score de uma determinada instância for superior ao threshold, esta instância é considerada anômala, caso contrário é classificada como normal. Neste trabalho foi utilizado um modelo Sparse Autoencoder (SAE) para a detecção de anomalias online que vem ganhando populari- dade neste cenário e foi investigado o impacto de diferentes abordagens não supervisionadas para definição de thresholds. Para os experimentos foi utilizada uma base de dados pública referente a um problema de detecção de anomalias no metrô da cidade do Porto. A aborda- gem de cálculo do threshold impactou fortemente as métricas de avaliação da detecção. Por exemplo, a abordagem baseada em erro máximo garantiu a menor taxa de falsos positivos. Por sua vez, a abordagem baseada em intervalo interquartil obteve o maior número de verdadeiros positivos, e, consequentemente recall, enquanto que a abordagem baseada em 99-percentil garantiu o maior F1-Score. Foi avaliado ainda o uso de três tipos de filtros passa-baixa em duas abordagens distintas para a suavização do score de anomalia. De uma forma geral, a aplicação de filtros diretamente sobre o score de anomalia maximizou verdadeiros positivos, enquanto sua aplicação após uma classificação prévia das instâncias minimizou os falsos posi- tivos. Além disso, foi verificado que a utilização do filtro foi essencial para detectar sequências de anomalias. Desta forma, a seleção de abordagens de definição de thresholds e de aplicação de filtros deve ser definida em função dos objetivos específicos do modelo.
publishDate 2024
dc.date.none.fl_str_mv 2024-08-07T13:54:06Z
2024-08-07T13:54:06Z
2024-01-25
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv LIRA, Maira Farias de Andrade. Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024.
https://repositorio.ufpe.br/handle/123456789/57246
identifier_str_mv LIRA, Maira Farias de Andrade. Abordagens para seleção de limiares de decisão e filtros de suavização em detecção de anomalias. 2024. Dissertação (Mestrado em Ciência da Computação) – Universidade Federal de Pernambuco, Recife, 2024.
url https://repositorio.ufpe.br/handle/123456789/57246
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Attribution-NonCommercial-NoDerivs 3.0 Brazil
http://creativecommons.org/licenses/by-nc-nd/3.0/br/
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
publisher.none.fl_str_mv Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
dc.source.none.fl_str_mv reponame:Repositório Institucional da UFPE
instname:Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
instname_str Universidade Federal de Pernambuco (UFPE)
instacron_str UFPE
institution UFPE
reponame_str Repositório Institucional da UFPE
collection Repositório Institucional da UFPE
repository.name.fl_str_mv Repositório Institucional da UFPE - Universidade Federal de Pernambuco (UFPE)
repository.mail.fl_str_mv attena@ufpe.br
_version_ 1834468329844113408