Ecologia Acústica e Ciência de Dados: uma análise da paisagem sonora do cerrado Aplicabilidade e desempenho de modelos de aprendizado de máquina na identificação de formações ecológicas.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Silva, Bruno Daleffi da
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3152/tde-19072024-094959/
Resumo: O Cerrado é um bioma brasileiro de grande importância ecológica, ocupando cerca de 2 milhões de quilômetros quadrados, o que corresponde a quase um quarto do território nacional. Este bioma possui papel relevante na manutenção da vida e do clima, concentrando cerca de 5% de todas as espécies (fauna) do planeta e formando o sistema hidrológico do Pantanal, um dos maiores complexos de água doce do mundo. Entretanto, o Cerrado enfrenta desafios devido ao avanço das atividades agropecuárias e ao aumento dos desastres ambientais, em decorrência das mudanças climáticas. Visando auxiliar os trabalhos de preservação e recuperação do bioma, este estudo explorou diferentes metodologias de Ciência de Dados para identificar a formação natural do Cerrado (Florestal, Savânica e Campestre) através da paisagem sonora do ambiente. Foram desenvolvidos cinco modelos estatísticos, utilizando coeficientes cepstrais de frequência mel (MFCCs) como variáveis independentes para os modelos de Gradient Boosting, Random Forest, Regressão Logística e Multilayer Perceptron, e imagens dos espectrogramas para a Rede Neural Convolucional (CNN). A análise dos resultados revelou que a CNN apresentou o melhor desempenho em todas as métricas avaliadas. Entretanto, a escolha do modelo mais adequado deve levar em consideração não apenas a performance, mas também a simplicidade do método, o tempo de resposta da predição e a capacidade de lidar com um grande número de observações em um curto período de tempo. Neste contexto, modelos mais simples, como Gradient Boosting ou Random Forest, podem ser mais apropriados em alguns casos. A aplicação da técnica de explicabilidade LIME auxiliou na compreensão dos processos de decisão do modelo de CNN, fornecendo insights sobre como melhorar sua performance e aplicação em estudos futuros de preservação e recuperação do bioma Cerrado. A análise das frequências relevantes para cada formação do Cerrado demonstrou o potencial dessa técnica na identificação das características do espectrograma responsáveis pela classificação das paisagens acústicas. Este estudo demonstra que a combinação de Ecologia Acústica e Ciência de Dados pode ser eficiente na classificação de paisagens acústicas e na identificação do tipo de formação do Cerrado. As conclusões deste trabalho podem servir como base para futuras pesquisas na área de Ecologia Acústica e na aplicação de técnicas de aprendizado de máquina em estudos ambientais, contribuindo para a preservação da biodiversidade e a recuperação de biomas ameaçados, como o Cerrado. Além disso, fornece insumos metodológicos para outras pesquisas acerca do uso da Inteligência Artificial/Machine Learning na identificação e classificação de sinais em geral.