Detalhes bibliográficos
Ano de defesa: |
2004 |
Autor(a) principal: |
Beneditto, Marco Eugênio Madeira Di |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://teses.usp.br/teses/disponiveis/45/45134/tde-20210729-134220/
|
Resumo: |
A descoberta de conhecimento em bancos de dados (KDD - Knowledge Discovery in Databases) é um tópico de pesquisa que envolve diversas áreas de interesse como Reconhecimento de Padrões, Aprendizado de Máquina, Bancos de Dados e Inteligência Artificial. KDD é definida como um processo não trivial de identificação de padrões válidos, novos, potencialmente úteis e compreensíveis incluídos nos dados. Na mineração de dados, uma das etapas do proceso de KDD, o uso de hierarquias de conceitos pode permitir a descoberta de conhecimento num nível de abstração mais elevado, compacto e muitas vezes mais interessante. Amineração de dados em múltiplos níveis conceituais é mais complexa do que a mineração num único nível, pois o espaço de busca é geralmente maior. Alguns trabalhos empregam a pré-generalização dos dados como forma de reduzir este espaço, dificultando a descoberta em níveis de abstração arbitrários. No entanto, para descobrir regrasa em diferentes níveis de generalidade de maneira eficiente, sem pré-generalizar os dados, é necessário um acesso rápido às hierarquias bem como métodos de avaliação de consultas velozes. Nesta dissertação, é apresentado o sistema NETUNO-HC que realiza indução de regras de classificação em diferentes níveis de generalidade, através do uso de hierarquias de conceitos sobre os valores dos atributos de um banco de dados, sejam eles numéricos ou categóricos. É mostrado como o nível de generalidade das regras descobertas é afetado pela estratégia de busca empregada e pela variação das medidas de relevância. Além disso, como é demonstrado através de uma série de experimentos, o sistema NETUNO-HC implementa técnicas que resultam num aumento de eficiência significativo, a saber: (i) uso de uma primitiva em SQL para efetuar as consultas ao banco de dados, (ii) codoficação numérica da hierarquia conceitual, (iii) estratégia de Busca em Feixe (Bream Search), (iv) codificação e indexação das regras descobertas numa tabela hash. |