OneTrack - Modelos Baseados em Transformers e Eficientes em Tempo de Inferência para Rastreamento de Múltiplos Objeto
Ano de defesa: | 2024 |
---|---|
Autor(a) principal: | |
Outros Autores: | , |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal do Amazonas
Instituto de Computação Brasil UFAM Programa de Pós-graduação em Informática |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://tede.ufam.edu.br/handle/tede/10421 |
Resumo: | O Rastreamento de Múltiplos Objetos (MOT) é um problema crítico na visão compu tacional, essencial para entender como objetos se movem e interagem em vídeos. Este campo enfrenta desafios significativos, oclusões e dinâmicas ambientais complexas afetam a precisão e eficiência dos modelos. Enquanto abordagens tradicionais têm se apoiado em Redes Neurais Convolucionais (CNNs), este trabalho apresenta o OneTrack M, um modelo MOT baseado em transformers, projetado para aumentar a eficiência computacional e a precisão do rastreamento. Nossa abordagem simplifica a arquitetura típica baseada em transformers, ao eliminar a necessidade de um modelo decodificador para detecção e rastreamento de objetos. Ao invés disso, apenas o codificador serve como base para a interpretação de dados temporais, reduzindo significativamente o tempo de processamento e aumentando a velocidade de inferência. Paralelamente, emprega-se técnicas inovadoras de pré-processamento de dados e treinamento mul titarefa para abordar desafios diversos de objetivos dentro de um único conjunto de pesos. Resultados experimentais demonstram o OneTrack-M alcançando tempos de inferência pelo menos 25% mais rápidos em comparação com modelos de ponta na literatura, mantendo ou melhorando as métricas de precisão de rastreamento. Essas melhorias destacam o potencial da solução proposta para aplicações em tempo real, como veículos autônomos e sistemas de vigilância, tais respostas rápidas são cruciais para a eficácia do sistema. |