Seleção de atributos baseado em algoritmos de agrupamento para tarefas de classificação

Detalhes bibliográficos
Ano de defesa: 2017
Autor(a) principal: Dantas, Carine Azevedo
Orientador(a): Canuto, Anne Magaly De Paula
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Programa de pós-graduação em sistemas e computação
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/26092
Resumo: Com o aumento do tamanho dos conjuntos de dados utilizados em sistemas de classicação, a seleção dos atributos mais relevantes se tornou uma das principais tarefas dafase de pré-processamento. Em um conjunto de dados é esperado que todos os atributosque o descreve sejam relevantes, porém isso nem sempre acontece. Selecionar o conjuntode atributos mais relevantes ajuda a reduzir a dimensionalidade dos dados sem afetaro desempenho, ou até mesmo melhorá-lo, para que se possa obter melhores resultadosquando utilizado na classicação de dados. Os métodos de seleção de características existentesselecionam os melhores atributos para uma base de dados como um todo, sem levarem consideração as particularidades de cada instância. A Seleção de atributos baseadaem algoritmos de agrupamento, método proposto deste trabalho, seleciona os atributosmais relevantes para cada grupo de instâncias, utilizando algoritmos de agrupamentopara agrupá-las de acordo com as suas semelhanças. Este trabalho efetua uma análiseexperimental de diferentes técnicas de agrupamento aplicadas a essa nova abordagem deseleção de atributos. Para isso, são utilizados os algoritmos de agrupamento k-Médias,DBscan e Expectation-Maximization(EM) como métodos de seleção. São efetuadas aná-lises de desempenho e estatísticas para vericar qual desses algoritmos de agrupamentomelhor se adequa a essa nova Seleção de Atributos. Assim, a contribuição deste trabalho éapresentar uma nova abordagem, através de uma versão Semidinâmica e outra Dinâmica,para seleção de atributos baseada em algoritmos de agrupamento e determinar qual dosmétodos de agrupamento realiza uma melhor seleção e obtém um melhor desempenho naconstrução de classicadores mais acurados.