Redução de dimensionalidade em séries temporais

Detalhes bibliográficos
Ano de defesa: 2006
Autor(a) principal: Sanches, Andre Rodrigo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-152334/
Resumo: O armazenamento de dados sequenciais (como as séries temporais, por exemplo) em bases de dados trouxe à tona a necessidade de desenvolvimento de técnicas eficientes de indexação e busca e também de tecnicas eficazes de mineração de dados. Devido ao tamanho das sequências, as séries temporais são em geral reduzidas em tamanho, principalmente para indexação e busca. Para a redução do tamanho das séries são utilizados diferentes algoritmos de redução de dimensionalidade. Os efeitos de diferentes tipos de redução são bastante investigados na literatura da área com respeito aos aspectos quantitativos tais como tempo de processamento, quantidade de memória requerida e número de acesso a páginas do disco. No entanto, não se observam muitos estudos que avaliam os efeitos sob o ponto de vista qualitativo. Neste trabalho propomos o uso de critéris objetivos para avaliar de que forma os resultados de atividades tais como busca por similaridade e cálculo de aglomerados (clustering) são afetados do ponto de vista qualitativo pelos diferentes algoritmos de redução de dimensionalidade. pram implementados quatro algoritmos de redução de dimesionalidade na plataforma R. Em busca por similaridade, foi avaliado o desempenho dos algoritmos na categoria de buscas conhecida por 'vizinhos mais próximos' e em aglomeração foram utilizados dois algoritmos de aglomeração. As avaliações foram realizadas em conjuntos de dados provenientes de uma central de atendimento