Melhorando a detecção de objetos pequenos com DETRAug

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: CUNHA, Evair de Jesus Silva
Orientador(a): ZANCHETTIN, Cleber
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/54814
Resumo: Neste trabalho é proposta uma nova abordagem para detecção de objetos chamada DE- TRAug. A nova técnica combina estratégias dos modelos Deformable DETR e AUGMIX. O AUGMIX é uma técnica para melhorar a robustez no treinamento de modelos de aprendiza- gem de máquina com base em mudanças na distribuição dos dados de treinamento e teste. O Deformable DETR é uma variante do modelo DETR, a qual obtém melhores resultados com detecção de objetos pequenos, além de apresentar um tempo de treinamento mais rápido que sua forma original. No DETRAug também focamos na ampliação da quantidade de ima- gens de treinamento e consequente adaptação das estratégias para detecção de objetos. Desta forma, a abordagem proposta busca produzir, de maneira estocástica, pequenas imagens com diferentes transformações, que no decorrer do processo de treinamento são encadeadas com o intuito de gerar uma imagem única a ser adicionada no conjunto de treinamento do modelo. A divergência de Jensen-Shannon, uma métrica bastante útil para modelagens com distribuições, foi utilizada para avaliar a função de Loss do modelo. No decorrer dos experimentos com o uso do DETRAug, foi possível verificar que o modelo proposto apresentou uma diminuição na quantidade de detecções "no-object", ou seja, nas detecções errôneas que o modelo produz. Durante os experimentos, esta nova versão foi comparada com os modelos DETR e Efficient- Det. A abordagem proposta foi avaliada em experimentos com seis datasets públicos. Ao fim dos experimentos, foi possível auferir uma melhoria de no mínimo 0.9% em relação a métrica mAP, também foi observada uma Loss de treinamento mais estável no modelo proposto. Além disso, é possível identificar visualmente uma melhora na detecção de objetos que, sob a mesma condição, são ignorados pelos outros modelos da literatura.