Utilizando redes neurais convolucionais siamesas para filtragem de imagens vazias em dados de armadilhas fotográficas

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Alencar, Luiz Fabio Bailosa de
Outros Autores: http://lattes.cnpq.br/2546953243319525
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
.
Link de acesso: https://tede.ufam.edu.br/handle/tede/10243
Resumo: As câmeras de armadilhas fotográficas são usadas para monitorar a vida selvagem de forma não invasiva através de tarefas como análise populacional de espécies e estudo do comportamento animal ao longo das estações do ano. No entanto, como as imagens são capturadas quando os sensores da câmera detectam movimento, muitas imagens sem animais são capturadas devido ao acionamento dos sensores por outros elementos, como árvores e folhas. Isso resulta em um acúmulo de imagens vazias que ocupam espaço na memória dos equipamentos e consomem largura de banda e energia da rede. Para resolver esse problema, é necessário utilizar métodos que permitam filtrar imagens vazias. No entanto, essa tarefa apresenta desafios, como a variação da vegetação entre diferentes locais, ao longo do dia e das estações do ano. Nesse contexto, o objetivo deste trabalho é desenvolver uma abordagem para filtragem de imagens vazias capturadas por câmeras de armadilhas fotográficas que leve em consideração o ambiente no qual as câmeras estão instaladas. A abordagem proposta é baseada em uma rede neural convolucional siamesa que recebe duas imagens de entrada: 1) uma imagem sem animais que apresenta as características da vegetação local e o nível aproximado de iluminação do dia; e 2) uma imagem capturada a partir do acionamento da câmera que será verificada quanto à presença ou não de animais na cena. Ao processar as duas imagens, a rede siamesa identifica as diferenças semânticas entre ambas para determinar a existência ou não de animais na imagem capturada. Os resultados obtidos nos experimentos mostram que a abordagem siamesa obteve precisão e acurácia superiores aos resultados obtidos por modelos de classificação que recebem apenas uma imagem por vez, como redes de convolução.