Estudo da influência dos métodos de conversão em escala de cinza para rastreamento baseado em descritores

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: MACÊDO, Samuel Victor Medeiros de
Orientador(a): KELNER, Judith
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/29698
Resumo: A área de rastreamento baseado em descritores tem adquirido importância crescente com as diversas aplicações de visão computacional no mercado. Ainda assim, há dificuldade em rastrear certos tipos de imagens, por exemplo, imagens obtidas em ambiente de baixa iluminação, borramentos devido a movimento da câmera ou imagens com padrões repetitivos. A otimização do processo de rastreamento é tratada exclusivamente na literatura a partir da otimização de software e da proposição de novas técnicas de extração. Contudo, nada foi encontrado na literatura sobre a etapa de conversão de imagens coloridas para imagens em tons de cinza. Isso foi percebido porque todas as bibliotecas e softwares de rastreamento encontrados na literatura e em uso no mercado usam exclusivamente o método Luminance de conversão para tons de cinza, e não há trabalhos na literatura investigando sua eficácia. O objetivo desta Tese, portanto, é identificar se algum método de conversão tem um desempenho tão superior aos demais que justifique a escolha dele como padrão por todas as bibliotecas existentes. Para averiguar essa questão, 13 métodos de conversão de imagens coloridas para tons de cinza, encontrados na literatura, foram comparados entre si, para, assim, definir se faz sentido haver um padrão fixo. A comparação é feita durante uma fase de pré-processamento de imagens, que, depois de concluída, permite que o rastreamento ocorra normalmente em tempo real, sendo apenas necessária para apontar conversões para tons de cinza que terão bom desempenho. O pré-processamento começa introduzindo um ruído uniforme na imagem. Em seguida, há a conversão para tons de cinza, segundo um dos 13 métodos encontrados, e são empregadas técnicas de extração de descritores (SIFT, SURF, e ORB). Com os descritores encontrados, é feita a estimativa de homografia e são avaliados os erros de projeção. O resultado do processo é uma lista de métodos de conversão que tiveram os melhores desempenhos naquele cenário, considerados métodos recomendados. Os resultados dos testes demonstram que todos os métodos de conversão são selecionados em algum momento como a melhor opção para algum grupo de imagens. Apesar de alguns métodos apresentarem em situações específicas melhores resultados que outros, de maneira geral nenhum método de conversão apresentou relevância suficiente para ser considerado um padrão genérico, como é hoje o Luminance. Inclusive, o Luminance apresentou desempenho insuficiente segundo os critérios de avaliação em diversos casos, tendo sido eliminado da lista de métodos recomendados em mais de 80% das ocorrências. Os testes de hipótese feitos confirmam que a diferença de performance entre os métodos que ficaram fora da lista e os recomendados é estatisticamente significativa. Dessa forma, conclui-se que a escolha do método de conversão para tons de cinza é relevante para a eficácia do rastreamento. Ao mesmo tempo, não há uma resposta universal para que método de conversão deve ser usado - nenhum deles apresenta um desempenho consistentemente melhor que os demais, independentemente do cenário. A solução sugerida nesta Tese é incluir uma fase de pré-processamento que avalia o desempenho específico de cada método e indica quais são mais adequados ao cenário.