Meta-learning for classifier ensemble optimization

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Schmitz, Christian
Orientador(a): Galante, Renata de Matos
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/277571
Resumo: À medida que o aprendizado de máquina se torna mais popular, é natural que profissionais de outras áreas e que não são especialistas queiram aproveitá-lo em suas tarefas. No entanto, selecionar um algoritmo e ajustá-lo para que funcione bem em uma determinada tarefa é complexo e requer conhecimento técnico em aprendizado de máquina, que os profissionais de outros domínios em geral não possuem. Esse problema fica ainda mais evidente quando são usados ensembles, pois o número de algoritmos a serem escolhidos e de hiperparâmetros a serem ajustados aumenta significativamente. Os ensembles são particularmente úteis em tarefas complexas que envolvem desafios como desequilíbrio de classe ou alta dimensionalidade, que são frequentemente encontrados em tarefas específicas de domínio. Assim, o desenvolvimento de mecanismos que ajudem o usuário não técnico a escolher e ajustar um modelo de ensembles para se resolver uma tarefa é de grande relevância na área de aprendizado de máquina. Nesta tese, é apresentado um novo framework chamado Meta-CLEO, que usa o meta-aprendizado para criar ensembles para novas tarefas relacionando-as com tarefas aprendidas anteriormente, aproveitando ensembles de classificadores que funcionaram bem em tarefas semelhantes no passado. Métricas de diversidade específicas de ensembles também são usadas para proporcionar maior generalização. Os experimentos realizados com 74 tarefas avaliaram diferentes algoritmos de ranqueamento de ensembles com base no desempenho do ensemble e nas métricas de diversidade e compararam os resultados do Meta-CLEO com dois baselines, Random Forest e AdaBoost. Os resultados mostram que o Meta-CLEO é equivalente ou tem desempenho superior aos baselines em mais de 75% das tarefas avaliadas.