Modelo integrado de mineração de dados para análise de séries temporais de preços de indicadores agroeconômicos.

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Corrêa, Fernando Elias
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/3/3141/tde-10112015-112734/
Resumo: Um dos principais setores da economia brasileira, o agronegócio envolve uma série de negociações dentro de toda a cadeia produtiva. Instituições de pesquisa como o CEPEA (Centro de Estudos Avançados em Economia Aplicada), da ESALQ/USP, coletam diariamente dados sobre diversos produtos agropecuários, gerando informações para agentes de diferentes categorias interessados no acompanhamento desses mercados, entre eles pesquisadores, produtores e formuladores de políticas públicas. O uso desses dados para realização de análises históricas integradas com análises atuais de mercado, porém, ainda é um desafio, dada a falta de uma padronização e a necessidade de identificação de técnicas computacionais adequadas. O objetivo desta tese é organizar as informações agroeconômicas consolidadas por meio de modelos de Data Mining e estatísticos para gerar análises integradas de relações entre as séries temporais, compreendendo produtos, mercados e o tempo, baseando-se nos dados obtidos pelo CEPEA em 7 anos de coleta diária de preços. As técnicas propostas para o modelo de análise integrada compreendem séries temporais para a projeção de trajetórias temporais e reconhecimento de padrões temporais. Especificamente para as trajetórias temporais, as técnicas utilizadas são de Matrizes de Correlações e Decomposição de Tucker e trajetórias, as quais permitem uma redução das matrizes e identificação de pontos relevantes no conjunto de dados. Já o reconhecimento de padrões nas séries temporais de grande volume de dados é obtido por meio de duas fases. Inicialmente, os dados são preparados utilizando-se as técnicas de redução de dimensionalidade e discretização. Posteriormente, é realizada a busca por motifs, que se utiliza de métricas de distâncias para encontrar similaridades entre as séries temporais ou entre sub partes de uma mesma série temporal para estas, destaca-se a aplicação do MINDIST e das distâncias euclidianas. Os resultados obtidos do modelo integrado são reportados em dois estudos de casos, sendo o primeiro sobre trajetórias temporais e o segundo, sobre identificação de padrões temporais. O conjunto de dados utilizado para ambos os casos foram preços comercialização de grãos no mercado interno do Brasil e valores negociados em Bolsa de valores de Chicago-EUA.