Detalhes bibliográficos
Ano de defesa: |
2018 |
Autor(a) principal: |
ARAÚJO, Rodrigo Cavalcanti de |
Orientador(a): |
CARVALHO, Francisco de Assis Tenório de |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/30973
|
Resumo: |
Modelos de agrupamento multi-view podem ser vistos como uma maneira de extrair informações de diferentes perspectivas dos dados para melhorar a precisão do particionamento resultante. No agrupamento de dados muti-view, é comum existir tabelas irrelevantes e, entre as relevantes, algumas podem ser mais ou menos importantes para contribuir na definição do particionamento final. Por esse motivo, a maior parte dos algoritmos existentes que trabalham com esse tipo de dado atribuem um peso a cada tabela com o objetivo de calcular as relevâncias destas visões no processo de agrupamento. No entanto, poucos algoritmos calculam, além do peso de relevância das visões, os pesos de relevância das variáveis dentro de cada visão com o objetivo de obter, também, a seleção automatizada desses atributos. Este trabalho propõe um algoritmo de agrupamento exclusivo do tipo c-means para dados muti-view que cálcula, de forma automática e simultânea, os pesos para tabelas e variáveis, de modo que as informações relevantes sejam selecionadas para definição da partição. Em comparação com trabalhos similares anteriores, uma vantagem do método proposto é que, além da necessidade de conhecer previamente o número de clusters, não há parâmetros adicionais que precisem ser ajustados. Para validação dos resultados, experimentos com conjuntos de dados de benchmark demonstram a utilidade do método proposto. |