Uma arquitetura para combinação de classificadores otimizada por métodos de poda com aplicação em credit scoring

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Silva Filho, Luiz Vieira e
Orientador(a): Cavalcanti, George D. C.
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
MCS
Link de acesso: https://repositorio.ufpe.br/handle/123456789/11564
Resumo: Sistemas de Múltiplos Classificadores (Multiple Classifiers Systems - MCS) se baseiam na ideia de que combinar a opinião de vários especialistas pode produzir melhores resultados do que quando se usa apenas um especialista. Diversas técnicas de MCS foram desenvolvidas, apresentando pontos fortes e fracos, a depender do contexto em que são aplicadas. Este trabalho propõe uma arquitetura para MCS que visa potencializar a complementaridade entre essas técnicas, possuindo dois objetivos principais: i) a combinação de métodos de amostragem tradicionais, visando a geração de classificadores de melhor desempenho que componham um pool de classificadores; ii) a aplicação de um algoritmo de poda para remover do pool aqueles classificadores incompetentes para lidar com o problema em questão, considerando os critérios de seleção adotados. A arquitetura proposta foi avaliada em uma aplicação de credit-scoring. Os métodos de amostragem usados foram o Bagging e o Random Subspace com classificadores-base sendo árvores-de-decisão, construídas com base no algoritmo CART. Para o processamento da poda foi usado o algoritmo Orientation Ordering, e para combinação das saídas dos classificadores do ensemble adotou-se o método Majority Vote. Os experimentos realizados mostraram que a arquitetura proposta alcançou taxas de acerto similares ou superiores às atingidas pelos métodos apresentados na literatura. Esses resultados ainda foram obtidos com ensembles cujos tamanhos eram da ordemde 20% dos pools originais gerados na fase de treinamento.