Algoritmos de agrupamento particionais baseados na Meta-heurística de otimização por busca em grupo

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: PACÍFICO, Luciano Demétrio Santos
Orientador(a): LUDERMIR, Teresa Bernardar
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/18002
Resumo: A Análise de Agrupamentos, também conhecida por Aprendizagem Não-Supervisionada, é uma técnica importante para a análise exploratória de dados, tendo sido largamente empregada em diversas aplicações, tais como mineração de dados, segmentação de imagens, bioinformática, dentre outras. A análise de agrupamentos visa a distribuição de um conjunto de dados em grupos, de modo que indivíduos em um mesmo grupo estejam mais proximamente relacionados (mais similares) entre si, enquanto indivíduos pertencentes a grupos diferentes tenham um alto grau de dissimilaridade entre si. Do ponto de vista de otimização, a análise de agrupamentos é considerada como um caso particular de problema de NP-Difícil, pertencendo à categoria da otimização combinatória. Técnicas tradicionais de agrupamento (como o algoritmo K-Means) podem sofrer algumas limitações na realização da tarefa de agrupamento, como a sensibilidade à inicialização do algoritmo, ou ainda a falta de mecanismos que auxiliem tais métodos a escaparem de pontos ótimos locais. Meta-heurísticas como Algoritmos Evolucionários (EAs) e métodos de Inteligência de Enxames (SI) são técnicas de busca global inspirados na natureza que têm tido crescente aplicação na solução de uma grande variedade de problemas difíceis, dada a capacidade de tais métodos em executar buscas minuciosas pelo espaço do problema, tentando evitar pontos de ótimos locais. Nas últimas décadas, EAs e SI têm sido aplicadas com sucesso ao problema de agrupamento de dados. Nesse contexto, a meta-heurística conhecida por Otimização por Busca em Grupo (GSO) vem sendo aplicada com sucesso na solução de problemas difíceis de otimização, obtendo desempenhos superiores a técnicas evolucionárias tradicionais, como os Algoritmos Genéticos (GA) e a Otimização por Enxame de Partículas (PSO). No contexto de análise de agrupamentos, EAs e SIs são capazes de oferecer boas soluções globais ao problema, porém, por sua natureza estocástica, essas abordagens podem ter taxas de convergência mais lentas quando comparadas a outros métodos de agrupamento. Nesta tese, o GSO é adaptado ao contexto de análise de agrupamentos particional. Modelos híbridos entre o GSO e o K-Means são apresentados, de modo a agregar o potencial de exploração oferecido pelas buscas globais do GSO à velocidade de exploitação de regiões locais oferecida pelo K-Means, fazendo com que os sistemas híbridos formados sejam capazes de oferecerem boas soluções aos problemas de agrupamento tratados. O trabalho apresenta um estudo da influência do K-Means quando usado como operador de busca local para a inicialização populacional do GSO, assim como operador para refinamento da melhor solução encontrada pela população do GSO durante o processo geracional desenvolvido por esta técnica. Uma versão cooperativa coevolucionária do modelo GSO também foi adaptada ao contexto da análise de agrupamentos particional, resultando em um método com grande potencial para o paralelismo, assim como para uso em aplicações de agrupamentos distribuídos. Os resultados experimentais, realizados tanto com bases de dados reais, quanto com o uso de conjuntos de dados sintéticos, apontam o potencial dos modelos alternativos de inicialização da população propostos para o GSO, assim como de sua versão cooperativa coevolucionária, ao lidar com problemas tradicionais de agrupamento de dados, como a sobreposição entre as classes do problema, classes desbalanceadas, dentre outros, quando em comparação com métodos de agrupamento existentes na literatura.