Detection and correction of deformations in UAVs’ images using deep learning
Ano de defesa: | 2021 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | eng |
Instituição de defesa: |
Universidade Federal de Uberlândia
Brasil Programa de Pós-graduação em Ciência da Computação |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://repositorio.ufu.br/handle/123456789/31755 http://doi.org/10.14393/ufu.di.2021.249 |
Resumo: | Nas últimas décadas, o crescimento populacional e a demanda por alimentos impulsionaram o uso de recursos tecnológicos no que chamamos de Agricultura de Precisão (AP). Dentre essas tecnologias, a utilização de Veículos Aéreos Não Tripulados (VANTs) tem-se destacado por auxiliar, potencializar e otimizar a produção agrícola. As imagens capturadas por VANTs permitem uma visão detalhada da região analisada, visto que o voo ocorre em altitudes baixas e médias (50m a 400m). Além disso, existe uma grande variedade de sensores (câmeras RGB, sensores de captura de calor, câmeras multi e hiperespectrais, entre outros), cada um com características próprias e capaz de produzir informações diferentes. No caso da aquisição de imagens multi espectrais, cada canal da imagem é adquirida por um sensor diferente e em momentos diferentes. Assim, muitas vezes, devido à características intríncecas ao voo do VANT e a própria natureza da aquisição, dois tipos principais de deformações entre as bandas de uma mesma imagem são comumente observadas, são elas: (1) lineares e (2) não lineares. As deformações lineares consistem, por exemplo, em transformações de rotação, translação e escala; já as não lineares possuem características variadas e sem um padrão previamente definido. Para a correta análise dessas imagens na AP, é necessário identificar e corrigir essas deformações. Diante disso, propõe-se o treinamento de redes neurais profundas para as tarefas de (1) identificação da presença da deformações e (2) a predição dos campos vetoriais de deformação para realizar o registro entre bandas de uma imagem multiespectral. Resultados evidenciam que tais técnicas se mostram promissoras para a solução do problema em questão. Para a identificação da presença de deformação, conseguimos uma precisão de 99,18% em imagens com deformações lineares e 99,25% para deformações não lineares. Além disso, a abordagem proposta alcançou uma precisão de 89,90% a 93,79% na tarefa de estimar o campo de deslocamento entre as bandas. De posse desse campo estimado pela rede, é possível realizar o registro entre as bandas sem a necessidade de marcação manual de pontos. |