Agrupamento de séries temporais utilizando decomposição de componentes estocásticos e determinísticos

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Silva, Mirlei Moura da
Orientador(a): Rios, Ricardo Araújo
Banca de defesa: Gomes, Gecynalda Soares da Silva, Mello, Rodrigo Fernandes de
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia
Instituto de Matemática e Estatística
Programa de Pós-Graduação: em Ciência da Computação
Departamento: Não Informado pela instituição
País: brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufba.br/ri/handle/ri/33695
Resumo: Com a grande quantidade de dados produzidos e coletados diariamente por diferentes sistemas, técnicas de aprendizado de máquina vêm sendo propostas com o intuito de auxiliar o processo de extração automática de informações. Dentre essas técnicas, pode-se destacar os algoritmos de agrupamento que buscam encontrar padrões e estruturas implı́citas em conjuntos de dados sem qualquer conhecimento fornecido à priori. Este trabalho de mestrado apresenta uma nova abordagem de agrupamento para dados, que possuem uma dependência temporal entre suas observações, conhecidos como séries temporais. A principal diferença dessa abordagem em relação aos trabalhos existentes na literatura baseia-se na hipótese de que dados coletados do mundo real possuem influências estocásticas e determinı́sticas que, se não forem individualmente analisadas, podem afetar o resultado do agrupamento. Neste sentido, a abordagem proposta avalia a importância da decomposição de séries temporais em componentes estocásticos e determinı́sticos no processo de agrupamento. Com isso, dados são agrupados analisando de maneira individual a similaridade entre cada componente. Os experimentos foram realizados em quatro etapas: i) a primeira etapa consistiu em verificar medidas para os componentes determinı́sticos; ii) na segunda etapa, foi proposta uma medida especı́fica para os componentes estocásticos; iii) a terceira etapa consistiu em avaliar o uso das medidas considerando os componentes estocásticos e determinı́sticos de séries temporais; iv) e, por fim, foi realizado o processo de agrupamento de séries temporais com ruı́do aditivo. A partir da decomposição das séries temporais, foi possı́vel observar que o processo de agrupamento melhorou significativamente os valores dos ı́ndices de validação externa.