Otimização da seleção dinâmica de ensemble em classificação: integrando seleção de protótipos e metaclassificadores

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Manastarla, Alberto
Orientador(a): Silva, Leandro Augusto da
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
eng
Instituição de defesa: Universidade Presbiteriana Mackenzie
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://dspace.mackenzie.br/handle/10899/40064
Resumo: No campo da aprendizagem de máquina, o uso de sistemas de múltiplos classificadores (MCS) tem sido reconhecido como eficaz para alcançar altas taxas de reconhecimento no campo de aprendizado de máquina. Entre esses sistemas, as técnicas de seleção dinâmica de ensemble (DES) se destacam, porque diferentes modelos ou classificadores podem ser competentes (ou es pecialistas) em diferentes regiões locais do espaço de características, também conhecidas como regiões de competência. Por essa razão, uma abordagem conveniente é selecionar o(s) modelo(s) mais promissor(es) para uma dada instância em análise. A competência dos classificadores, ge ralmente, é estimada de acordo com um determinado critério, calculado na vizinhança (região de competência) da instância em análise, definida em um conjunto de validação previamente esta belecido. Um problema surge quando há um alto grau de ruído nos dados de validação, fazendo com que as instâncias pertencentes à região de competência não representem a instância em análise. Nesses casos, a técnica de seleção dinâmica pode escolher um classificador (modelo) que se ajustou demais ou se subajustou à região de competência em questão, em vez daquele com o melhor desempenho de generalização. Também, uma outra questão importante no DES é definir o critério adequado para calcular a competência dos classificadores, considerando que existem diversos critérios disponíveis. Usar apenas um critério pode levar a uma estimativa ina dequada da competência do(s) classificador(es). Para abordar essas questões, foi desenvolvido o SGP-DES (Self-generating Prototype Dynamic Ensemble Selection), um novo framework de seleção dinâmica de ensemble que combina técnicas de seleção de protótipos, extração de me tainformações e um metaclassificador versátil. A versatilidade deste metaclassificador provém de sua capacidade de operar tanto com modelos otimizados quanto com modelos baseados em instâncias, ambos destinados a avaliar e selecionar de forma dinâmica, a partir de um pool de classificadores inicialmente gerado, os classificadores mais promissores para compor os ensem bles de classificadores finais que farão a predição do rótulo de classe das instâncias analisadas durante a fase de generalização do framework. O SGP-DES incorpora diversos critérios de se leção para avaliar a competência dos classificadores e adapta-se às variações nas condições de classificação. Ele utiliza metacaracterísticas derivadas das regiões de competência das instân cias analisadas, estabelecidas por protótipos representativos do conjunto de treinamento original que foram utilizados para formar o conjunto de validação. Essa estratégia permite ao metaclas sificador prever quais serão os classificadores mais eficazes, dado uma instância em análise. No entanto, a adequação de alguns critérios de seleção pode variar conforme o tipo de problema de classificação. Condições particulares nos dados, como alta demanda de armazenamento, resposta lenta do processo de classificação e baixa tolerância a ruídos, podem comprometer a eficiência ou precisão desses critérios. Por isso, é importante que o método de seleção de pro tótipos, responsável por formar o conjunto de validação e de onde serão definidas as regiões de competência das instâncias analisadas, seja adaptável ao problema de classificação em questão, de modo a otimizar a eficácia do metaclassificador no processo de seleção dos classificadores mais aptos para predizer corretamente o rótulo de classe das instâncias analisadas. Experimentos realizados com conjuntos de dados públicos amplamente conhecidos na literatura demonstraram que o SGP-DES supera os métodos DES de última geração, assim como os métodos tradicionais de modelo único e de ensemble, em termos de acurácia, confirmando sua eficácia em uma ampla gama de contextos de classificação.