Árvore de decisão por agrupamento com DBSCAN aproximativo

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Goulart, Jorge Luiz de Jesus
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade do Estado do Rio de Janeiro
Centro de Tecnologia e Ciências::Instituto de Matemática e Estatística
Brasil
UERJ
Programa de Pós-Graduação em Ciências Computacionais e Modelagem Matemática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.bdtd.uerj.br/handle/1/23352
Resumo: O aprendizado de máquina tem como objetivo geral criar sistemas que podem aprender com dados, identificar padrões e tomar decisões com o mínimo de intervenção humana. Em geral, métodos de aprendizado de máquina empregam diversos conceitos geométricos, envolvendo pontos no espaço multidimensional. Por outro lado, na literatura de algoritmos para a resolução de conceitos geométricos, há inúmeros algoritmos dessa natureza que envolvem procedimentos randomizados e aproximativos. Tais procedimentos resultam ora em melhoria de complexidade de tempo esperada, ora na simplificação da implementação desses algoritmos. Esta tese apresenta uma variante do modelo de árvore de decisão, na qual novos predicados são considerados para particionar os dados. Ao invés de empregar apenas predicados univariados (associados a uma única característica do dado) como é o caso da árvore de decisão ordinária, a nova variante considera também predicados multicaracterísticas. Tais predicados consistem em separar os dados pela pertinência dos mesmos a cada um dos grupos produzidos pelo modelo de agrupamento não-supervisionado DBSCAN. O algoritmo do DBSCAN possui complexidade computacional de tempo elevada para ser diretamente integrado às árvores de decisão. Assim, a proposta consiste no emprego de uma versão aproximativa de tempo linear do algoritmo DBSCAN, para suavizar tal impacto. A tese faz a proposta além de fazer experimentos em diversas bases de referência em aprendizado de máquina.