Comparação e avaliação de técnicas de aprendizado de máquina para modelagem de distribuição de espécies na região da Bacia Amazônica.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Miyaji, Renato Okabayashi
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-26082024-110959/
Resumo: Uma das técnicas mais utilizadas para o monitoramento da biodiversidade é a Modelagem de Distribuição de Espécies. Através dela, é possível identificar as variáveis que mais influenciam na ocorrência de uma espécie e seu nicho ecológico. Como desenvolvimento de modelos de Aprendizado de Máquina que apresentam uma acurácia mais elevada, essa abordagem passou a ser amplamente adotada. Entretanto, existem desafios relacionados à aplicação dessas técnicas por contadas incertezas relacionadas à classe negativa, do desbalanceamento entre classes e de sua capacidade de interpretação. Dessa forma, nesta pesquisa buscou-se avaliar melhorias no procedimento metodológico e realizar uma comparação entre as técnicas de Aprendizado de Máquina, como a Regressão Logística, as Árvores de Decisão, as Florestas Aleatórias, Gradient Boosting, Extreme Gradient Boosting, as Máquinas de Vetores de Suporte (Support Vector Machines) e o Modelo de Máxima Entropia, de modo a avaliar a viabilidade do uso dessas técnicas para a Modelagem de Distribuição de Espécies. O melhor desempenho para ROC-AUC foi obtido pelo Gradient Boosting com 94%, considerando a métrica de Sensibilidade, o melhor foi o de Máxima Entropia com 85%. O modelo que apresentou os melhores ROC-AUC e Sensibilidade ao mesmo tempo foi o de Florestas Aleatórias. Essas técnicas foram avaliadas não só em relação ao desempenho de previsão, mas também a sua capacidade de explicação, utilizando técnicas de Inteligência Artificial Explicável. No centro da Floresta Amazônica, Manaus (AM) é considerada um laboratório ideal para o estudo dos efeitos da ação antrópica nos ecossistemas terrestres. Por isso, foram utilizados os dados de ocorrência de espécies da região, em conjunto com dados meteorológicos e de aerossóis obtidos por meio de coletas realizadas pelo projeto Go Amazon 2014/2015. A partir deles, foi aplicada uma técnica de interpolação espacial para aumentar sua resolução, gerando um novo conjunto de dados. Assim, foi possível validar as melhorias propostas na metodologia em um estudo de caso, concluindo que a aplicação de métodos de reamostragem, em conjunto com classificadores e técnicas de Inteligência Artificial Explicável possibilitam a realização dos experimentos de Modelagem de Distribuição de Espécies com sucesso.