Utilização do problema das k-medianas como critério para o agrupamento de dados semi-supervisionado

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Randel, Rodrigo Alves
Orientador(a): Aloise, Daniel
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/22569
Resumo: Agrupamento de dados é uma poderosa ferramenta para análise automática de dados. Essa técnica se propõe a resolver o seguinte problema: dado um conjunto de entidades, encontrar subconjuntos, denominados clusters, que são homogêneos e/ou bem separados. O maior desafio do agrupamento de dados é encontrar um critério que apresente boa separação de dados em grupos homogêneos, e que estes agrupamentos possam trazer informações úteis ao usuário. Para resolver este problema, é sugerido que o usuário possa fornecer informações prévias a respeito do conjunto de dados que auxiliem/guiem o processo de agrupamento. Realizar o agrupamento de dados utilizando essas informações auxiliares é denominado de agrupamento de dados semi-supervisionado (ADSS). Este trabalho explora o problema de ADSS utilizando um novo modelo: os dados são agrupados através da resolução do problemas das k-medianas. Resultados mostram que essa abordagem foi capaz de agrupar os dados de forma eficiente para problemas de ADSS em diversos domínios diferentes.