Detalhes bibliográficos
Ano de defesa: |
2025 |
Autor(a) principal: |
Privatto, Vitor Hugo Monteiro [UNESP] |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual Paulista (Unesp)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://hdl.handle.net/11449/295530
|
Resumo: |
Em diversos problemas é interessante o uso de algoritmos inerentemente interpretáveis, uma vez que facilita o entendimento do conhecimento obtido e das predições realizadas. Dentre estes algoritmos encontram-se os classificadores associativos. Estes mesclam as tarefas de associação e classificação e são, portanto, induzidos em etapas, a saber: [a] extração de um conjunto de regras, [b] ranqueamento das regras via medidas objetivas e [c] poda das regras. Embora a classificação associativa, assim como outras técnicas, apresente bons resultados, quando aplicada a problemas desbalanceados o desempenho não se mantém o mesmo. O desbalanceamento ocorre quando o número de instâncias de uma dada classe, chamada de majoritária, supera em muito o número de instâncias da outra classe, chamada de minoritária. Deste modo, soluções vem sendo desenvolvidas de modo a diferenciar corretamente as instâncias de ambas as classes. Assim, este trabalho explora o uso de classificadores associativos quando aplicados em dados desbalanceados via abordagens internas, i.e., em nível de algoritmo. Para tanto, três objetivos são propostos. O primeiro se refere a execução de uma revisão sistemática da literatura a fim de identificar as abordagens internas que vêm sendo adotadas e/ou propostas a fim de fundamentar este trabalho, assim como identificar lacunas e oportunidades na área. Tendo como base as lacunas identificadas, o segundo objetivo explora o impacto das diferentes estratégias levantadas na revisão para se realizar a extração de regras (etapa [a]) visando identificar a mais adequada a ser utilizada no contexto aqui apresentado. Como resultado recomenda-se o uso da estratégia Apriori-C, já adotada pelo CBA2, algoritmo baseline neste contexto. Por fim, o terceiro objetivo é voltado a proposta de um método de seleção dinâmica de medidas objetivas, denominado DyOMS, a fim de ranquear as regras da melhor maneira possível (etapa [b]). A motivação ocorre em função dos trabalhos identificados na revisão utilizarem poucas das medidas objetivas existentes na literatura de maneira estática, i.e., pré-estabelecida, mesmo sabendo-se que não existe uma medida que seja adequada a todas as explorações, já que o seu desempenho depende das próprias características das regras extraídas e, portanto, do conjunto de dados utilizado. Como resultado foi possível notar que o DyOMS se apresenta como uma solução viável ao contexto aqui apresentado em relação a alguns baselines. |