Uma base de imagens de folhas de feijão e uma rede neural profunda para estimativa não-destrutiva de área foliar

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Silva, Karla Gabriele Florentino da lattes
Orientador(a): Vieira, Marcelo Bernardes lattes
Banca de defesa: Villela, Saulo Moraes lattes, Pedrini, Hélio lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Juiz de Fora (UFJF)
Programa de Pós-Graduação: Programa de Pós-graduação em Ciência da Computação
Departamento: ICE – Instituto de Ciências Exatas
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://doi.org/10.34019/ufjf/di/2023/00092
https://repositorio.ufjf.br/jspui/handle/ufjf/16916
Resumo: As folhas desempenham papel fundamental para o corpo vegetal ao realizarem fotossíntese e as características morfológicas (e.g., área foliar) associadas a sua superfície são parâmetros que podem contribuir para explicar respostas a diversos processos, como mudanças climáticas, relações ecológicas e produtividade agrícola. Porém, a maioria dos métodos para medição das dimensões de superfícies foliares existentes são trabalhosos e onerosos. Além de utilizarem muitas das vezes abordagens destrutivas que impossibilitam acompanhar o crescimento da planta. Neste contexto, construiu-se uma nova base de imagens anotadas para estimativa não destrutiva das dimensões (área, largura, comprimento e perímetro) de superfícies de folhas de feijão, com base em um marcador de realidade virtual adicionado na cena. A construção do conjunto de dados envolveu um processo de plantio, aquisição de imagens, colheita das folhas, medição manual das dimensões reais, segmentação semi-automática e estimativa de pose do marcador. Além disso, desenvolveu-se uma nova rede neural profunda que receba uma imagem de entrada contendo uma folha saliente acompanhada de um marcador, e retorne a estimativa da área foliar pela comparação entre as proporções dos dois objetos na imagem. O modelo proposto é baseado na arquitetura de uma rede neural de segmentação semântica. A hipótese principal é que é possível adaptar uma rede neural convolucional para realizar a regressão da área dos pixels da imagem. Assim, propõe-se um novo módulo decodificador para a rede, utilizado para remapear a representação da imagem na estimativa da área relativa dos objetos de interesse, folha e marcador. O modelo apresentado é composto por um codificador e dois decodificadores, que estimam a segmentação da imagem e a área dos pixels dos objetos de interesse. Também define-se uma forma para calcular a perda deste decodificador e critérios para seleção do melhor modelo. Para determinar a viabilidade da proposta realiza-se uma análise extensiva, em termos quantitativos e qualitativos, do comportamento das predições do modelo para 1033 imagens de 90 folhas distintas. Os resultados obtidos evidenciam que o modelo é capaz de aprender a estimar a área dos objetos de interesse tendo apenas uma imagem de entrada.