Algoritmo de clusterização difusa multi-medoides para dados relacionais com múltiplas visões

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: SIMÕES, Eduardo Cintra
Orientador(a): CARVALHO, Francisco de Assis Tenório de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/36683
Resumo: Quando se deseja separar um conjunto de elementos sem um conhecimento prévio das suas classes, é necessário utilizar métodos de classificação não-supervisionada, que separam os elementos pelas suas similaridades, mantendo elementos muito distintos em grupos (clusters) diferentes. Contudo, obter um conjunto de características para os elementos pode ser mais custoso do que obter dados relacionais, como a similaridade entre os elementos. Muitas vezes é possível comparar os elementos com diferentes critérios (visões), o que oferece mais informações para distinguir os elementos, permitindo a geração de matrizes de dissimilaridade distintas. Contudo, nem sempre as visões são relevantes para a solução, por causa disso, vários modelos propostos ponderam as diferentes visões, reduzindo a influência daquelas irrelevantes. Em muitas situações, existem elementos com características de várias classes, de forma que classificar um elemento numa única classe não o representa bem. Para melhor representar os elementos nesse tipo de situação, foram desenvolvidos métodos de classificação difusa, que definem graus de pertinência dos elementos para cada classe (em oposição a classificação crisp, que mapeia cada elemento para apenas 1 classe). Os métodos de classificação, assim como vários outros métodos de inteligência artificial, precisam ser configurados para obter resultados melhores, utilizando um conjunto de parâmetros para isso. Contudo, quanto mais parâmetros um método possui, mais custoso se torna a busca por bons parâmetros. Dessa forma, reduzir o número de parâmetros sem afetar os resultados é uma excelente melhoria para um método. Esta dissertação tem como objetivo apresentar um modelo de classificação difusa não-supervisionada para dados relacionais com múltiplas visões. Sendo uma variação do modelo FW4M com um parâmetro a menos, mas com resultados similares ou melhores. O método proposto será comparado com o modelo FW4M e outros dois modelos com propósitos similares ( e MFCMdd-RWG-P) sobre um conjunto de bases de dados, utilizando métricas relevantes para comparar as classificações considerando tanto a partição difusa quanto a crisp.