Métodos clássicos e baseados em aprendizado de máquina para previsão de preço de tomate in natura

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Almeida, João Paulo Mendes de lattes
Orientador(a): Guimarães, Alaine Margarete lattes
Banca de defesa: Campos Júnior, Arion de lattes, Pellini, Tiago lattes
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual de Ponta Grossa
Programa de Pós-Graduação: Programa de Pós Graduação Computação Aplicada
Departamento: Departamento de Informática
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://tede2.uepg.br/jspui/handle/prefix/4094
Resumo: Prever os preços agrícolas é crucial para a tomada de decisões e impacta a renda dos agricultores, os preços dos alimentos e a economia como um todo. O tomate é uma das principais olerícolas produzidas e comercializadas no Brasil, com um mercado dinâmico afetado por fatores como variações climáticas e sazonalidade. Este estudo tem como objetivo comparar o desempenho de diferentes métodos clássicos e baseados em aprendizado de máquina na previsão dos preços do tomate nos mercados atacadistas Ceagesp e Ceasa/PR. Os métodos de previsão ARIMA, SARIMA, ARIMAX, SVR, LSTM e CNN foram utilizados, e dados de séries temporais sobre os preços do tomate e outras variáveis correlacionadas foram coletados entre 2010 e 2021. O teste ADF foi utilizado para determinar a ordem de diferenciação necessária para tornar a série estacionária. A análise de componentes principais foi usada para reduzir a dimensionalidade dos dados, extraindo um número menor de componentes que representam a maior parte da variação observada nos dados. O teste de Ljung-Box foi aplicado para analisar os resíduos e verificar a adequação do modelo aos dados observados. O desempenho dos diferentes modelos foi analisado utilizando as métricas RMSE e MAPE. A análise da importância das variáveis é uma etapa importante nos modelos de aprendizado de máquina e foi aplicada para identificar as variáveis preditoras mais influentes sobre a variável de resposta. O teste estatístico não paramétrico de Wilcoxon foi usado para avaliar a diferença entre os modelos candidatos. Os resultados mostraram que algumas variáveis estavam altamente correlacionadas entre si. Este estudo concluiu que o modelo SVR teve uma precisão maior em comparação com outros modelos. A escolha do método mais adequado pode variar de acordo com o objetivo da previsão, o período, a disponibilidade e a qualidade dos dados, entre outros fatores.