Análise comparativa de métodos de seleção de variáveis em problemas de classificação
Ano de defesa: | 2024 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Dissertação |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de São Carlos
Câmpus São Carlos |
Programa de Pós-Graduação: |
Programa Interinstitucional de Pós-Graduação em Estatística - PIPGEs
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Palavras-chave em Inglês: | |
Área do conhecimento CNPq: | |
Link de acesso: | https://repositorio.ufscar.br/handle/20.500.14289/21177 |
Resumo: | In this study, a comprehensive comparison between the SHAP method and the Lasso method for variable selection is presented. The methodologies of both techniques are explored and juxtaposed, utilizing key selection metrics such as precision, recall, F1 score, and accuracy in both simulated and real database scenarios. The tests applied show SHAP as a good competitor for variable selection methods, with results even slightly superior to Lasso in the cases presented here, both on a simulated and real basis, maintaining competitive accuracy levels in relation to the complete model. Despite being somewhat close in accuracy, SHAP notably reduces the variable space, demonstrating its selection prowess. Additionally, a robustness study involving perturbation values in training, testing, and combined datasets confirms the resilience of the variables selected by SHAP, particularly in terms of accuracy. These analyses underscore the efficacy of the SHAP method as a versatile and potent tool for variable selection, promising improved interpretability and performance in machine learning applications. |