Um modelo para explicação de decisões locais de classificadores baseado em algoritmos genéticos com preservação da diversidade de populações

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Santos, Daniel Augusto dos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/
Resumo: O uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais.