Integração mineração de dados – SGBD não é uma panacéia: estudo da integração do algoritmo Apriori Quantitativo ao Oracle9i.

Detalhes bibliográficos
Ano de defesa: 2002
Autor(a) principal: SANTOS, Maria de Fátima Almeida.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/11786
Resumo: Inicialmente os algoritmos de Mineração de Dados eram utilizados em arquivos de dados especialmente preparados com esta finalidade, sem a gerência de SGBD’s. Entretanto, pesquisas recentes começaram a aparecer com o objetivo de integrar esses dois mundos, visando aliar o potencial das técnicas de mineração às conhecidas vantagens dos SGBD’s como, por exemplo, controle e atomicidade de transações, segurança, robustez e otimização de consultas. Este trabalho é principalmente sobre a implementação de um algoritmo de mineração de dados considerado estado-da-arte em modelos de regras de associação, denominado Apriori Quantitativo [4], estreitamente integrado com o SGBDOR Oracle9i. O algoritmo praticamente inexiste além da literatura especializada, isto é, nunca tinha sido testado e usado em outros trabalhos. Os resultados obtidos foram então comparados com o clássico algoritmo de regras de associação Apriori [2], também integrado ao Oracle9i, visando avaliar em que medida o primeiro seria superior ao último. Os resultados, de uma certa forma desconcertantes, permite-nos concluir que integrar algoritmos de mineração de dados a SGBD’s não é uma panacéia. Os problemas que tivemos com a integração do Apriori Quantitativo ao Oracle9i são discutidos em detalhes, as conclusões gerais da experiência sendo inferidas. As bases de dados utilizadas pelos algoritmos foram modeladas de duas formas distintas: a primeira, puramente relacional; a segunda, objeto-relacional, fazendo uso do conceito de tipo coleção de dados. Desta forma, um outro objetivo desta dissertação foi verificar a influência das estruturas de dados relacional e objeto-relacional sobre o desempenho dos algoritmos, à procura de conclusões gerais e úteis sobre a superioridade de uma sobre a outra.