Re-identificação de pessoas em múltiplas câmeras por meio de imagens digitais

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Cordeiro, Alexssandro Ferreira lattes
Orientador(a): Paula Filho, Pedro Luiz de lattes
Banca de defesa: Paula Filho, Pedro Luiz de lattes, Candido Junior, Arnaldo lattes, Schneider, Fabio Kurt lattes, Lopes, Rui Pedro Sanches de Castro
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Tecnológica Federal do Paraná
Medianeira
Programa de Pós-Graduação: Programa de Pós-Graduação em Tecnologias Computacionais para o Agronegócio
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.utfpr.edu.br/jspui/handle/1/29695
Resumo: A detecção de pessoas ainda é um problema na visão computacional, bem como o rastreamento e a RE-ID (pré-identificação de pessoas), principalmente em ambientes com múltiplas câmeras. Os avanços das redes neurais convolucionais para essas tarefas implicaram em ganho de desempenho nos últimos anos, visto que há um aumento na quantidade de dados públicos anotados para treinamento supervisionado, desta maneira permitindo treinamentos mais eficientes. Porém com as dificuldades presentes nas tarefas de detecção ao RE-ID e rastreamento de pessoas como oclusões, variações da iluminação e a qualidade da imagem capturada ainda se faz necessário estudos a fim de aumentar a acurácia destas tarefas. Usando uma plataforma para a análise do fluxo de pessoas e possível fornecer informações as quais podem otimizar a segurança, vigilância e demais setores da agroindústria, local com forte presença humana. O estudo apresentado aqui se utilizou de técnicas de processamento digital de imagens e redes neurais convolucionais como a Darknet-53 com o framework YOLOV3, o qual apresentou resultados no estado da arte na detecção de objetos e ser utilizado para efetuar a detecção de pessoas e, a partir desta detecção, ser ˜ a possível efetuar a pré-identificação com base na área de interesse detectada. Para o problema de RE-ID foi utilizada a rede neural RESNET50 nas arquiteturas siamesa e triplet loss com os datasets públicos CUHK03 e Market-1501, sendo o primeiro utilizado para o treinamento e o segundo para validação. Os resultados apresentados no treinamento de RE-ID com a arquitetura triplet loss no dataset CUHK03 foram comparados ao estado da arte e apresentaram resultados superiores nos requisitos mAP com 81,40% em relação 80,70% do benchmark e CMC RANK-1 de 84,80% em relação a 84,30% do ` benchmark no dataset CUHK03, na validação com o dataset Market-1501 a rede triplet loss apresentou CMC RANK-1 de 84,50% em relação a 85,00% do benchmark, demonstrando capacidade de generalização em ambientes nunca vistos pela rede. Estes resultados confirmam que e possível obter informações sobre o fluxo de pessoas a fim de auxiliar setores da agroindústria como segurança, vigilância e administração de pessoal.