OneTrack - Modelos Baseados em Transformers e Eficientes em Tempo de Inferência para Rastreamento de Múltiplos Objeto

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Araújo Filho, Luiz Carlos
Outros Autores: http://lattes.cnpq.br/6173408842316575, https://orcid.org/ 0000-0002-7501-2087
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
.
Mot
Link de acesso: https://tede.ufam.edu.br/handle/tede/10421
Resumo: O Rastreamento de Múltiplos Objetos (MOT) é um problema crítico na visão compu tacional, essencial para entender como objetos se movem e interagem em vídeos. Este campo enfrenta desafios significativos, oclusões e dinâmicas ambientais complexas afetam a precisão e eficiência dos modelos. Enquanto abordagens tradicionais têm se apoiado em Redes Neurais Convolucionais (CNNs), este trabalho apresenta o OneTrack M, um modelo MOT baseado em transformers, projetado para aumentar a eficiência computacional e a precisão do rastreamento. Nossa abordagem simplifica a arquitetura típica baseada em transformers, ao eliminar a necessidade de um modelo decodificador para detecção e rastreamento de objetos. Ao invés disso, apenas o codificador serve como base para a interpretação de dados temporais, reduzindo significativamente o tempo de processamento e aumentando a velocidade de inferência. Paralelamente, emprega-se técnicas inovadoras de pré-processamento de dados e treinamento mul titarefa para abordar desafios diversos de objetivos dentro de um único conjunto de pesos. Resultados experimentais demonstram o OneTrack-M alcançando tempos de inferência pelo menos 25% mais rápidos em comparação com modelos de ponta na literatura, mantendo ou melhorando as métricas de precisão de rastreamento. Essas melhorias destacam o potencial da solução proposta para aplicações em tempo real, como veículos autônomos e sistemas de vigilância, tais respostas rápidas são cruciais para a eficácia do sistema.