Extração de Mapas de Profundidades de Dense Light Fields usando Deep Learning

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Ferrugem, Anderson Priebe
Orientador(a): Zatt, Bruno
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pelotas
Programa de Pós-Graduação: Programa de Pós-Graduação em Computação
Departamento: Centro de Desenvolvimento Tecnológico
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://guaiaca.ufpel.edu.br/handle/prefix/9236
Resumo: Diversos sistemas de imageamento utilizam a metrologia por imagem para medir, identificar, inspecionar e diagnosticar. A demanda crescente por sistemas de metrologia visual em diversas áreas que necessitam de sensores compactos e robustos tem impulsionado o desenvolvimento de dispositivos para captura. Es tes sensores utilizam diferentes grandezas físicas para o imageamento e cálculo das distâncias, cada um com suas limitações e vantagens. Entre as tecnologias emergentes de imageamento, que usam apenas a informação de luz visível, temos destaque para o uso de imagens light field capturadas através de câmeras light field densas ou esparsas, que possuem vantagens intrínsecas em relação aos dispositivos tradicionais. Por exemplo, essas câmeras são robustas em situações específicas de oclusão e também em cenas com ambientes ruidosos (chuva, neve, etc.). Isso faz com que câmeras light field, também chamadas de câmeras plenópticas, possuam potencial de uso como um versátil sensor com múltiplas aplicações. Essa capacidade é pouco aproveitada devido as características ópticas complexas relacionadas ao sistema de captura e ao custo computacional do processamento relacionado. Para se extrair o mapa de profundidade usando métodos geométricos tradicionais é necessário estimar n-variáveis, atualizar seus valores e realizar novos cálculos a cada mudança de parâmetro. Ao se usar redes neurais artificiais, essas relações já ficam implícitas na própria rede neural, o que permite uma resposta imediata a modificação dinâmica dos parâmetros. Essa tese apresenta duas técnicas para extração de mapas de profundidade de imagens light field densas baseadas em redes neurais com aprendizado profundo. A primeira proposta simplifica a rede EPINET, reduzindo o fluxo de quatro entradas para apenas duas entradas. Já a segunda proposta explora a rede de entrada multifluxo em uma rede neural convolucional u-shaped. Cada proposta é explorada e por fim são apresentadas suas vantagens e desvantagens. Ambas propostas calculam mapas de profundidade em tempos menores que a EPINET original.