Detalhes bibliográficos
Ano de defesa: |
2024 |
Autor(a) principal: |
Miyaji, Renato Okabayashi |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/3/3141/tde-26082024-110959/
|
Resumo: |
Uma das técnicas mais utilizadas para o monitoramento da biodiversidade é a Modelagem de Distribuição de Espécies. Através dela, é possível identificar as variáveis que mais influenciam na ocorrência de uma espécie e seu nicho ecológico. Como desenvolvimento de modelos de Aprendizado de Máquina que apresentam uma acurácia mais elevada, essa abordagem passou a ser amplamente adotada. Entretanto, existem desafios relacionados à aplicação dessas técnicas por contadas incertezas relacionadas à classe negativa, do desbalanceamento entre classes e de sua capacidade de interpretação. Dessa forma, nesta pesquisa buscou-se avaliar melhorias no procedimento metodológico e realizar uma comparação entre as técnicas de Aprendizado de Máquina, como a Regressão Logística, as Árvores de Decisão, as Florestas Aleatórias, Gradient Boosting, Extreme Gradient Boosting, as Máquinas de Vetores de Suporte (Support Vector Machines) e o Modelo de Máxima Entropia, de modo a avaliar a viabilidade do uso dessas técnicas para a Modelagem de Distribuição de Espécies. O melhor desempenho para ROC-AUC foi obtido pelo Gradient Boosting com 94%, considerando a métrica de Sensibilidade, o melhor foi o de Máxima Entropia com 85%. O modelo que apresentou os melhores ROC-AUC e Sensibilidade ao mesmo tempo foi o de Florestas Aleatórias. Essas técnicas foram avaliadas não só em relação ao desempenho de previsão, mas também a sua capacidade de explicação, utilizando técnicas de Inteligência Artificial Explicável. No centro da Floresta Amazônica, Manaus (AM) é considerada um laboratório ideal para o estudo dos efeitos da ação antrópica nos ecossistemas terrestres. Por isso, foram utilizados os dados de ocorrência de espécies da região, em conjunto com dados meteorológicos e de aerossóis obtidos por meio de coletas realizadas pelo projeto Go Amazon 2014/2015. A partir deles, foi aplicada uma técnica de interpolação espacial para aumentar sua resolução, gerando um novo conjunto de dados. Assim, foi possível validar as melhorias propostas na metodologia em um estudo de caso, concluindo que a aplicação de métodos de reamostragem, em conjunto com classificadores e técnicas de Inteligência Artificial Explicável possibilitam a realização dos experimentos de Modelagem de Distribuição de Espécies com sucesso. |