Desenvolvimento de módulo para segmentação de espaço livre em imagens estéreo com prototipação em FPGA

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: ISHIMARU, Pedro Jorge Américo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/44090
Resumo: A Segmentação de regiões livres e superfície do chão é uma questão de grande importân- cia no contexto da robótica e de veículos terrestres autônomos. Este problema, relacionado à área de percepção de espaço, é amplamente discutido na literatura especializada, sendo abordado por meio de diferentes técnicas de processamento de imagem, como uso de Redes Neurais Artificiais, Métodos Estatísticos e Métodos Algébricos para processar vários possíveis tipos de sinais de entrada, como por exemplo, imagens monocromáticas e coloridas, som, La- ser e imagens estéreo. Entretanto, os métodos propostos para realizar segmentação de espaço livre geralmente possuem altos custos computacionais, envolvendo operações de convolução e manipulações matriciais. Portanto, para obter melhores desempenhos, essas técnicas normal- mente são implementadas em plataformas de maior poder computacional. Paradoxalmente, isto pode ser impeditivo para aplicações em robótica e veículos autônomos, uma vez que é comum que tecnologias embarcadas estejam sob rígidas restrições de capacidade computa- cional, memória, consumo de potência e custo. Neste contexto, este trabalho propõe uma arquitetura em FPGA para realizar segmentação da superfície do chão usando técnicas de visão computacional estéreo, isto é, usando mapas de disparidades gerados a partir de um par de imagens estéreo. Foi projetado uma arquitetura em FPGA baseada em um algorimo de referência usando técnicas algébricas que exploram informação tridimensional para detectar regiões de obstáculo, regiões livres e horizonte a partir da extração do perfil característico destes objetos. A validação do algoritmo de referência e do módulo proposto usou o dataset KITTI para detecção de superfície de estrada, que contém imagens do mundo real de cenários automotivos. Os resultados, comparados com outras técnicas da literatura, mostraram uma baixa perda de qualidade, considerando as métricas de precisão e sensitividade, com aumentos significativos, na ordem de 10 vezes, nas taxas de processamento em frames por segundo, consolidando o trabalho como um módulo promissor para aplicações envolvendo robótica e visão computacional estéreo.