Agrupamento de séries temporais utilizando decomposição de componentes estocásticos e determinísticos
Ano de defesa: | 2018 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | , |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal da Bahia
Instituto de Matemática e Estatística |
Programa de Pós-Graduação: |
em Ciência da Computação
|
Departamento: |
Não Informado pela instituição
|
País: |
brasil
|
Palavras-chave em Português: | |
Área do conhecimento CNPq: | |
Link de acesso: | http://repositorio.ufba.br/ri/handle/ri/33695 |
Resumo: | Com a grande quantidade de dados produzidos e coletados diariamente por diferentes sistemas, técnicas de aprendizado de máquina vêm sendo propostas com o intuito de auxiliar o processo de extração automática de informações. Dentre essas técnicas, pode-se destacar os algoritmos de agrupamento que buscam encontrar padrões e estruturas implı́citas em conjuntos de dados sem qualquer conhecimento fornecido à priori. Este trabalho de mestrado apresenta uma nova abordagem de agrupamento para dados, que possuem uma dependência temporal entre suas observações, conhecidos como séries temporais. A principal diferença dessa abordagem em relação aos trabalhos existentes na literatura baseia-se na hipótese de que dados coletados do mundo real possuem influências estocásticas e determinı́sticas que, se não forem individualmente analisadas, podem afetar o resultado do agrupamento. Neste sentido, a abordagem proposta avalia a importância da decomposição de séries temporais em componentes estocásticos e determinı́sticos no processo de agrupamento. Com isso, dados são agrupados analisando de maneira individual a similaridade entre cada componente. Os experimentos foram realizados em quatro etapas: i) a primeira etapa consistiu em verificar medidas para os componentes determinı́sticos; ii) na segunda etapa, foi proposta uma medida especı́fica para os componentes estocásticos; iii) a terceira etapa consistiu em avaliar o uso das medidas considerando os componentes estocásticos e determinı́sticos de séries temporais; iv) e, por fim, foi realizado o processo de agrupamento de séries temporais com ruı́do aditivo. A partir da decomposição das séries temporais, foi possı́vel observar que o processo de agrupamento melhorou significativamente os valores dos ı́ndices de validação externa. |