Detalhes bibliográficos
Ano de defesa: |
2021 |
Autor(a) principal: |
Colombo, Alexandre |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
http://hdl.handle.net/11449/204306
|
Resumo: |
Mineração de padrões frequentes e regras de associação são um dos principais campos de pesquisa em Mineração de Dados, que apresenta o objetivo de determinar relações consistentes entre elementos. Algoritmos existentes neste campo de estudo se baseiam principalmente na informação de ocorrência dos elementos. Entretanto, considerar a ausência de elementos para a geração de regras pode resultar em associações de grande interesse para algumas aplicações, que poderá fornecer conhecimento até então desconhecido para o cientista de dados ou analista. Este tipo de associação é denominada regra de associação negativa, e a sua principal característica é a explosão da quantidade de regras geradas, que demanda uma capacidade computacional adequada para seu processamento. Neste projeto de mestrado foram exploradas diversas abordagens, e proposto um método que apresenta como principais objetivos acelerar o processo de geração de regras, e permitir que conjuntos de dados maiores possam ser minerados. Considerando a etapa de identificação de conjuntos frequentes, este método dispõe de quatro abordagens que exploram plataformas paralelas de computação. Estas apresentam destaque em situações específicas, de forma que a depender do conjuntos de dados a ser analisado, será recomendada o uso de uma destas. Na etapa de geração de regras do método proposto também são exploradas plataformas paralelas. Através dos resultados obtidos foi possível verificar que o método alcança os objetivos propostos. Além disso, o método desenvolvido permite minerar conjuntos de dados grandes que são considerados restritivos para implementações existentes. Por fim, foi constatado que o método desenvolvido é escalável, permitindo melhorar seu desempenho com o incremento de recursos computacionais. |