Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis

ARAÚJO, Rodrigo Cavalcanti de

Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis

Detalhes bibliográficos
Ano de defesa:	2018
Autor(a) principal:	ARAÚJO, Rodrigo Cavalcanti de
Orientador(a):	Não Informado pela instituição
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Pernambuco UFPE Brasil Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação:	Não Informado pela instituição
Departamento:	Não Informado pela instituição
País:	Não Informado pela instituição
Palavras-chave em Português:	Inteligência computacional Agrupamento de dados
Link de acesso:	https://repositorio.ufpe.br/handle/123456789/30973
Resumo:	Modelos de agrupamento multi-view podem ser vistos como uma maneira de extrair informações de diferentes perspectivas dos dados para melhorar a precisão do particionamento resultante. No agrupamento de dados muti-view, é comum existir tabelas irrelevantes e, entre as relevantes, algumas podem ser mais ou menos importantes para contribuir na definição do particionamento final. Por esse motivo, a maior parte dos algoritmos existentes que trabalham com esse tipo de dado atribuem um peso a cada tabela com o objetivo de calcular as relevâncias destas visões no processo de agrupamento. No entanto, poucos algoritmos calculam, além do peso de relevância das visões, os pesos de relevância das variáveis dentro de cada visão com o objetivo de obter, também, a seleção automatizada desses atributos. Este trabalho propõe um algoritmo de agrupamento exclusivo do tipo c-means para dados muti-view que cálcula, de forma automática e simultânea, os pesos para tabelas e variáveis, de modo que as informações relevantes sejam selecionadas para definição da partição. Em comparação com trabalhos similares anteriores, uma vantagem do método proposto é que, além da necessidade de conhecer previamente o número de clusters, não há parâmetros adicionais que precisem ser ajustados. Para validação dos resultados, experimentos com conjuntos de dados de benchmark demonstram a utilidade do método proposto.

Um modelo de agrupamento multi-view com ponderação simultânea de tabelas e variáveis

Registros relacionados