Uso de aprendizado de máquina interpretável na avaliação da produtividade de povoamentos de eucalipto

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Lopes, Lucas Sérgio de Sousa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Viçosa
Ciência Florestal
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://locus.ufv.br//handle/123456789/32337
https://doi.org/10.47328/ufvbbt.2024.167
Resumo: As ferramentas de inteligência artificial, como os algoritmos de aprendizado de máquina e as redes neurais artificiais, evoluíram rapidamente a partir de ideias baseadas nas teorias do aprendizado comportamental e cognitivo, até alcançarem os princípios do aprendizado de máquina interpretável. Técnicas post-hoc de interpretabilidade podem ser úteis para modelar a produtividade de povoamentos florestais, possibilitando compreender as relações entre as variáveis preditoras e a produção volumétrica na idade de corte. O objetivo desta tese foi aplicar e avaliar diferentes tipos de técnicas de aprendizado de máquina interpretável para predizer a produtividade média aos 7 anos (IMA7) de povoamentos de eucalipto no norte de Minas Gerais. Para tal, a tese foi estruturada em três capítulos: I) Revisão de literatura sobre aprendizado de máquina; II) Técnicas post-hoc de aprendizado de máquina para predizer a produtividade de povoamentos de eucalipto; III) Interpretabilidade de variáveis preditoras da produtividade de povoamentos de eucalipto utilizando perturbação de redes neurais artificiais. Utilizou-se uma base de dados composta por 320 talhões localizados em povoamentos de clones de híbridos de Eucalyptus urophylla x Eucalyptus grandis em Minas Gerais. Os algoritmos random forest, gradient boosting machine, árvore de decisão e redes neurais artificiais (RNA) foram treinados para generalizar a produtividade aos 7 anos em função de 304 variáveis preditoras classificadas em silviculturais, ambientais e de manejo. Técnicas de interpretabilidade pós-hoc e de perturbação de RNA foram aplicadas para identificar as variáveis com maiores importâncias relativas. As técnicas post-hoc permitiram visualizar os efeitos das variáveis de maior importância para o IMA7: altitude 9,7 m³ha⁻¹ano⁻¹ (38%), teor de argila no solo 4,9 m³ha⁻¹ano⁻¹ (19,3%), teor de matéria orgânica 2,4 m³ha⁻¹ano⁻¹ (9,5%) e dias úmidos na idade de um ano do povoamento 1,7 m³ha⁻¹ano⁻¹ (6,7%). A ampliação de bancos de dados a partir da simulação de variáveis e adição de novas variáveis gerou importâncias relativas distintas pela perturbação de RNA. Todas as técnicas de interpretabilidade de modelos de aprendizado de máquina incluíram a altitude, o teor de matéria orgânica e o teor de argila como variáveis de maior importância relativa para predizer o IMA7. Palavras-chave: Tratos silviculturais; Perturbação de redes neurais artificiais; Eucalipto-produtividade; Gradient boosting machine; Random forest; Árvore de decisão; Redes neurais artificiais.