Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
Amaral, Thábata |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/55/55134/tde-29072020-114915/
|
Resumo: |
A tarefa de Descoberta de Regras de Associação tem o objetivo de descobrir relacionamentos úteis e compreensivos em dados frequentes e infrequentes. Enquanto padrões frequentes descrevem um comportamento comum, padrões infrequentes representam comportamentos que raramente ocorrem. O interesse deste trabalho reside em encontrar regras de exceção, isto é, padrões que embora ocorram com pouca frequência, possuem efeitos potencialmente críticos como consequência. As abordagens existentes para Mineração de Regras de Exceção lidam com bases de dados de itemsets, em que as transações são organizadas sem informação temporal. No entanto, a temporalidade pode ser inerente a alguns contextos reais e deve ser considerada para melhorar a qualidade semântica dos resultados. Além disso, a maioria dessas abordagens possui alto custo computacional (de ordem exponencial), tornando-se inviáveis para minerar grandes volumes de dados. Com o objetivo de superar essas limitações, este trabalho propõe TRiER (TempoRal Exception Ruler), um método eficiente e escalável para Mineração de Regras de Exceção Temporais. Especificamente, o método proposto não apenas descobre comportamentos excepcionais e seus respectivos agentes causadores, mas também identifica quanto tempo as consequências demoram para aparecer. Foi realizada uma análise experimental em dados reais para verificar a aplicabilidade prática do TRiER. Os resultados obtidos mostram que o método possui menor custo computacional e é mais escalável do que os métodos correlatos, além de encontrar regras com maior relevância semântica. |