Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions

Ribeiro, Manassés

Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions

Detalhes bibliográficos
Ano de defesa:	2018
Autor(a) principal:	Ribeiro, Manassés
Orientador(a):	Lopes, Heitor Silvério
Banca de defesa:	Lopes, Heitor Silvério, Comunello, Eros, Thomaz, Carlos Eduardo, Oliveira, Luiz Eduardo Soares de, Neto, Hugo Vieira
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Tecnológica Federal do Paraná Curitiba
Programa de Pós-Graduação:	Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial
Departamento:	Não Informado pela instituição
País:	Brasil
Palavras-chave em Português:	Aprendizado do computador Redes neurais (Computação) Códigos corretores de erros (Teoria da informação) Convoluções (Matemática) Processamento de imagens - Técnicas digitais Sistemas de reconhecimento de padrões Visão por computador Métodos de simulação Engenharia elétrica Machine learning Neural networks (Computer science) Error-correcting codes (Information theory) Convolutions (Mathematics) Image processing - Digital techniques Pattern recognition systems Computer vision Simulation methods Electric engineering
Área do conhecimento CNPq:	CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO
Link de acesso:	http://repositorio.utfpr.edu.br/jspui/handle/1/3172
Resumo:	A detecção de anomalias em vídeos de vigilância é um tema de pesquisa recorrente em visão computacional. Os métodos de aprendizagem profunda têm alcançado o estado da arte para o reconhecimento de padrões em imagens e o Autocodificador Convolucional (ACC) é uma das abordagens mais utilizadas por sua capacidade em capturar as estruturas 2D dos objetos. Neste trabalho, a detecção de anomalias se refere ao problema de encontrar padrões em vídeos que não pertencem a um conceito normal esperado. Com o objetivo de classificar anomalias adequadamente, foram verificadas formas de aprender representações relevantes para essa tarefa. Por esse motivo, estudos tanto da capacidade do modelo em aprender características automaticamente quanto do efeito da fusão de características extraídas manualmente foram realizados. Para problemas de detecção de anomalias do mundo real, a representação da classe normal é uma questão importante, sendo que um ou mais agrupamentos podem descrever diferentes aspectos de normalidade. Para fins de classificação, esses agrupamentos devem ser tão compactos (densos) quanto possível. Esta tese propõe o uso do ACC como uma abordagem orientada a dados aplicada ao contexto de detecção de anomalias em vídeos. Foram propostos métodos para o aprendizado de características espaço-temporais, bem como foi introduzida uma abordagem híbrida chamada Autocodificador Convolucional com Incorporação Compacta (ACC-IC), cujo objetivo é melhorar a compactação dos agrupamentos normais. Além disso, foi proposto um novo critério de parada baseado na sensibilidade e sua adequação para problemas de detecção de anomalias foi verificada. Todos os métodos propostos foram avaliados em conjuntos de dados disponíveis publicamente e comparados com abordagens estado da arte. Além do mais, foram introduzidos dois novos conjuntos de dados projetados para detecção de anomalias em vídeos de vigilância em rodovias. O ACC se mostrou promissor na detecção de anomalias em vídeos. Resultados sugerem que o ACC pode aprender características espaço-temporais automaticamente e a agregação de características extraídas manualmente parece ser valiosa para alguns conjuntos de dados. A compactação introduzida pelo ACC-IC melhorou o desempenho de classificação para a maioria dos casos e o critério de parada baseado na sensibilidade é uma nova abordagem que parece ser uma alternativa interessante. Os vídeos foram analisados qualitativamente de maneira visual, indicando que as características aprendidas com os dois métodos (ACC e ACC-IC) estão intimamente correlacionadas com os eventos anormais que ocorrem em seus quadros. De fato, ainda há muito a ser feito para uma definição mais geral e formal de normalidade, de modo que se possa ajudar pesquisadores a desenvolver métodos computacionais eficientes para a interpretação dos vídeos.

Deep learning methods for detecting anomalies in videos: theoretical and methodological contributions

Registros relacionados