Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão

Lima, Mateus Curcino de

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão

Detalhes bibliográficos
Ano de defesa:	2017
Autor(a) principal:	Lima, Mateus Curcino de
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Uberlândia Brasil Programa de Pós-graduação em Ciência da Computação
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Computação Mineração de dados (Computação) Banco de dados Agrupamento semi-supervisionado Análise de dados em alta dimensão Hubness Data mining High-dimensional data analysis Semi-supervised clustering CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
Link de acesso:	https://repositorio.ufu.br/handle/123456789/18309
Resumo:	The curse of dimensionality turns the high-dimensional data analysis a challenging task for data clustering techniques. Recent works have efficiently employed an aspect inherent to high-dimensional data in the proposal of clustering approaches guided by hubs which provide information about the distribution of the data instances among the K-nearest neighbors. Though, hubs can not well reflect the implicit semantics of the data, leading to an unsuitable data partition. In order to cope with both issues (i.e., high-dimensional data and meaningful clusters), this dissertation presents a clustering approach that explores the combination of two strategies: semi-supervision and density estimation based on hubness scores. The experimental results conducted with 23 real datasets show that the proposed approach has a good performance when applied on datasets with different characteristics.

Combinando semi-supervisão e hubness para aprimorar o agrupamento de dados em alta dimensão

Registros relacionados