Detalhes bibliográficos
Ano de defesa: |
2022 |
Autor(a) principal: |
Ferraz, Inhaúma Neves |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Tese
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://app.uff.br/riuff/handle/1/26091
|
Resumo: |
As regras de associação constituem uma técnica muito popular da mineração de dados. Apesar de sua simplicidade e eficiência, o método apresenta dois pontos que poderiam ser melhorados usando critérios semânticos. O primeiro deles é a geração de uma grande quantidade de associações inúteis, o que somente prejudica o trabalho dos analistas do negócio, que tentam encontrar oportunidades e/ou explicações para os dados armazenados. O segundo ponto é o fato de muita informação presente nos repositórios de informação poder passar despercebida, pela incapacidade dos métodos de mineração captarem os relacionamentos entre os dados armazenados. Isto obriga os analistas, que buscam interpretar/avaliar os resultados da mineração, a incorporar o conhecimento do domínio em seus modelos mentais que dependem de suas experiências. Para minimizar o excesso de regras mineradas, já são utilizadas técnicas de pós-processamento, que procuram podar os resultados da mineração, eliminando regras consideradas menos importantes. Estas técnicas baseiam-se em critérios sintáticos, que utilizam a freqüência de ocorrência de itens e a estrutura das regras, para determinar o ponto de corte. A presente pesquisa utiliza a semântica do conhecimento de mundo, existente nas ontologias, para explorar o relacionamento entre os atributos do domínio. Assim, consegue enriquecer, em conteúdo, o conjunto de Regras de Associação mineradas e, ao mesmo tempo, reduzir a cardinalidade desse mesmo conjunto, aumentando a precisão, quando aplicado no pós-processamento, e aumentando o “recall”, quando aplicado no pré-processamento. O modelo SemPrune desenvolvido executa poda semântica no pósprocessamento das Regras de Associação mineradas, e o enriquecimento semântico dos resultados no pós-processamento ou no pré-processamento, de acordo com as condições da Base de Transações analisada. Foram analisados domínios com relacionamentos dos tipos “é-um” e “parte-de”, cardinalidades 1:n e m:n, desenvolvendo-se algoritmos para cada caso. Os resultados obtidos, cuja avaliação foi feita por meio de experimentos realizados sobre Bases de Dados públicas mostraram-se satisfatórios. |