Uso de aprendizado de máquina interpretável na avaliação da produtividade de povoamentos de eucalipto

Lopes, Lucas Sérgio de Sousa

Uso de aprendizado de máquina interpretável na avaliação da produtividade de povoamentos de eucalipto

Detalhes bibliográficos
Ano de defesa:	2024
Autor(a) principal:	Lopes, Lucas Sérgio de Sousa
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Tese
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Viçosa Ciência Florestal
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Silvicultura Eucalipto Redes neurais Aprendizado de máquina Manejo Florestal
Link de acesso:	https://locus.ufv.br//handle/123456789/32337 https://doi.org/10.47328/ufvbbt.2024.167
Resumo:	As ferramentas de inteligência artificial, como os algoritmos de aprendizado de máquina e as redes neurais artificiais, evoluíram rapidamente a partir de ideias baseadas nas teorias do aprendizado comportamental e cognitivo, até alcançarem os princípios do aprendizado de máquina interpretável. Técnicas post-hoc de interpretabilidade podem ser úteis para modelar a produtividade de povoamentos florestais, possibilitando compreender as relações entre as variáveis preditoras e a produção volumétrica na idade de corte. O objetivo desta tese foi aplicar e avaliar diferentes tipos de técnicas de aprendizado de máquina interpretável para predizer a produtividade média aos 7 anos (IMA7) de povoamentos de eucalipto no norte de Minas Gerais. Para tal, a tese foi estruturada em três capítulos: I) Revisão de literatura sobre aprendizado de máquina; II) Técnicas post-hoc de aprendizado de máquina para predizer a produtividade de povoamentos de eucalipto; III) Interpretabilidade de variáveis preditoras da produtividade de povoamentos de eucalipto utilizando perturbação de redes neurais artificiais. Utilizou-se uma base de dados composta por 320 talhões localizados em povoamentos de clones de híbridos de Eucalyptus urophylla x Eucalyptus grandis em Minas Gerais. Os algoritmos random forest, gradient boosting machine, árvore de decisão e redes neurais artificiais (RNA) foram treinados para generalizar a produtividade aos 7 anos em função de 304 variáveis preditoras classificadas em silviculturais, ambientais e de manejo. Técnicas de interpretabilidade pós-hoc e de perturbação de RNA foram aplicadas para identificar as variáveis com maiores importâncias relativas. As técnicas post-hoc permitiram visualizar os efeitos das variáveis de maior importância para o IMA7: altitude 9,7 m³ha⁻¹ano⁻¹ (38%), teor de argila no solo 4,9 m³ha⁻¹ano⁻¹ (19,3%), teor de matéria orgânica 2,4 m³ha⁻¹ano⁻¹ (9,5%) e dias úmidos na idade de um ano do povoamento 1,7 m³ha⁻¹ano⁻¹ (6,7%). A ampliação de bancos de dados a partir da simulação de variáveis e adição de novas variáveis gerou importâncias relativas distintas pela perturbação de RNA. Todas as técnicas de interpretabilidade de modelos de aprendizado de máquina incluíram a altitude, o teor de matéria orgânica e o teor de argila como variáveis de maior importância relativa para predizer o IMA7. Palavras-chave: Tratos silviculturais; Perturbação de redes neurais artificiais; Eucalipto-produtividade; Gradient boosting machine; Random forest; Árvore de decisão; Redes neurais artificiais.

Uso de aprendizado de máquina interpretável na avaliação da produtividade de povoamentos de eucalipto

Registros relacionados