Segmentação de plantas daninhas por meio de redes neurais convolucionais em imagens de alta resolução capturadas por ARP

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Freitas, Allana Pracuccio [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
CNN
Link de acesso: https://hdl.handle.net/11449/261567
Resumo: A presença de plantas daninhas ocasiona diversos prejuízos nas culturas agrícolas, podendo provocar a diminuição na produtividade, redução da qualidade final do produto colhido, disseminação de pragas e doenças e até mesmo a perda total das lavouras. Uma vez que se possa controlar essas plantas daninhas, é possível elevar tanto a qualidade quanto a quantidade da produção, além de reduzir os impactos ambientais por meio da diminuição no uso de defensivos agrícolas. Desta forma, técnicas que permitem o reconhecimento automático das plantas daninhas são extremamente relevantes para a agricultura. A metodologia proposta nesta dissertação de Mestrado utilizou a arquitetura U-Net modificada, empregando os backbones ResNet-34, EfficientNet-B0 e Inception-V3 de Convolutional Neural Networks (CNNs), a fim de realizar a segmentação de mamonas, planta daninha com maior ocorrência na cultura de cana-de-açúcar recém-plantada da área de estudo. Foi utilizada a Aeronave Remotamente Pilotada (ARP) do modelo eBee X para embarcar a câmera Sequoia e capturar imagens multiespectrais e RGB. Por meio dessas imagens foram gerados ortofotomosaicos multiespectrais e RGB, que serviram para a criação da base de dados composta pelo ortofotomosaico NDVI, ortofotomosaico RGB e suas respectivas máscaras binárias geradas por meio da vetorização das mamonas. Foram implementadas técnicas de data augmentation para aumentar o conjunto de dados e transfer learning para os backbones utilizarem pesos pré-treinados com o conjunto de dados do ImageNet. Foram avaliados os dados de entrada contidos na base de dados e identificado um problema de desbalanceamento de classes que prejudicou a segmentação das mamonas. Em vista dessa problemática, foram removidos os dados que não continham a presença de plantas daninhas para equilibrar a classe background e mamona. Os resultados indicam que o modelo mais eficiente para os dados NDVI foi alcançado ao empregar a arquitetura simples da U-Net, sem modificação e sem aplicar o transfer learning. Esse modelo alcançou valores para as métricas Dice (79,75%), F1 (79,73%), IoU (66,66%) e Acurácia (98,17%). Para os dados RGB o modelo que utilizou a arquitetura ResNet-34 obteve o melhor resultado nas métricas com valores de Dice (83,56%), F1 (83,61%), IoU (72,09%) e Acurácia (97,66%). Os resultados mostraram um bom percentual de predição para a segmentação de mamonas em vista do conjunto de dados ser pequeno e pouco diversificado. Além disso, qualitativamente, o modelo realizou a segmentação das mamonas de maneira precisa e eficaz.