Uso de aprendizado de máquina interpretável na avaliação da produtividade de povoamentos de eucalipto
Ano de defesa: | 2024 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Viçosa
Ciência Florestal |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://locus.ufv.br//handle/123456789/32337 https://doi.org/10.47328/ufvbbt.2024.167 |
Resumo: | As ferramentas de inteligência artificial, como os algoritmos de aprendizado de máquina e as redes neurais artificiais, evoluíram rapidamente a partir de ideias baseadas nas teorias do aprendizado comportamental e cognitivo, até alcançarem os princípios do aprendizado de máquina interpretável. Técnicas post-hoc de interpretabilidade podem ser úteis para modelar a produtividade de povoamentos florestais, possibilitando compreender as relações entre as variáveis preditoras e a produção volumétrica na idade de corte. O objetivo desta tese foi aplicar e avaliar diferentes tipos de técnicas de aprendizado de máquina interpretável para predizer a produtividade média aos 7 anos (IMA7) de povoamentos de eucalipto no norte de Minas Gerais. Para tal, a tese foi estruturada em três capítulos: I) Revisão de literatura sobre aprendizado de máquina; II) Técnicas post-hoc de aprendizado de máquina para predizer a produtividade de povoamentos de eucalipto; III) Interpretabilidade de variáveis preditoras da produtividade de povoamentos de eucalipto utilizando perturbação de redes neurais artificiais. Utilizou-se uma base de dados composta por 320 talhões localizados em povoamentos de clones de híbridos de Eucalyptus urophylla x Eucalyptus grandis em Minas Gerais. Os algoritmos random forest, gradient boosting machine, árvore de decisão e redes neurais artificiais (RNA) foram treinados para generalizar a produtividade aos 7 anos em função de 304 variáveis preditoras classificadas em silviculturais, ambientais e de manejo. Técnicas de interpretabilidade pós-hoc e de perturbação de RNA foram aplicadas para identificar as variáveis com maiores importâncias relativas. As técnicas post-hoc permitiram visualizar os efeitos das variáveis de maior importância para o IMA7: altitude 9,7 m³ha⁻¹ano⁻¹ (38%), teor de argila no solo 4,9 m³ha⁻¹ano⁻¹ (19,3%), teor de matéria orgânica 2,4 m³ha⁻¹ano⁻¹ (9,5%) e dias úmidos na idade de um ano do povoamento 1,7 m³ha⁻¹ano⁻¹ (6,7%). A ampliação de bancos de dados a partir da simulação de variáveis e adição de novas variáveis gerou importâncias relativas distintas pela perturbação de RNA. Todas as técnicas de interpretabilidade de modelos de aprendizado de máquina incluíram a altitude, o teor de matéria orgânica e o teor de argila como variáveis de maior importância relativa para predizer o IMA7. Palavras-chave: Tratos silviculturais; Perturbação de redes neurais artificiais; Eucalipto-produtividade; Gradient boosting machine; Random forest; Árvore de decisão; Redes neurais artificiais. |