Conhecimento do mundo como instrumento enriquecedor dos resultados obtidos na mineração de dados

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Ferraz, Inhaúma Neves
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://app.uff.br/riuff/handle/1/26091
Resumo: As regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios.