Detalhes bibliográficos
Ano de defesa: |
2006 |
Autor(a) principal: |
Sanches, Andre Rodrigo |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-152334/
|
Resumo: |
O armazenamento de dados sequenciais (como as séries temporais, por exemplo) em bases de dados trouxe à tona a necessidade de desenvolvimento de técnicas eficientes de indexação e busca e também de tecnicas eficazes de mineração de dados. Devido ao tamanho das sequências, as séries temporais são em geral reduzidas em tamanho, principalmente para indexação e busca. Para a redução do tamanho das séries são utilizados diferentes algoritmos de redução de dimensionalidade. Os efeitos de diferentes tipos de redução são bastante investigados na literatura da área com respeito aos aspectos quantitativos tais como tempo de processamento, quantidade de memória requerida e número de acesso a páginas do disco. No entanto, não se observam muitos estudos que avaliam os efeitos sob o ponto de vista qualitativo. Neste trabalho propomos o uso de critéris objetivos para avaliar de que forma os resultados de atividades tais como busca por similaridade e cálculo de aglomerados (clustering) são afetados do ponto de vista qualitativo pelos diferentes algoritmos de redução de dimensionalidade. pram implementados quatro algoritmos de redução de dimesionalidade na plataforma R. Em busca por similaridade, foi avaliado o desempenho dos algoritmos na categoria de buscas conhecida por 'vizinhos mais próximos' e em aglomeração foram utilizados dois algoritmos de aglomeração. As avaliações foram realizadas em conjuntos de dados provenientes de uma central de atendimento |