Detalhes bibliográficos
Ano de defesa: |
2022 |
Autor(a) principal: |
Santos, Daniel Augusto dos |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/59/59143/tde-17112023-112559/
|
Resumo: |
O uso de aprendizado de máquina em domínios diversos é cada vez mais comum. No entanto, muitas aplicações críticas não podem usufruir desta tecnologia sem que as decisões de um classificador sejam interpretáveis. O problema é que a maioria dos modelos se comporta como uma caixa-preta cujas decisões não são facilmente interpretáveis, o que limita sua efetividade apesar do bom desempenho. Diversos trabalhos na literatura buscam resolver este problema propondo técnicas de decisão que explicam o comportamento de modelos caixa-preta quando estes são aplicados a um determinado exemplo. Uma delas é a técnica Local Rule Based Explanations (LORE) que gera explicações locais, utilizando uma Árvore de Decisão treinada a partir de dados artificiais gerados por um algoritmo genético (AG). O método LORE utiliza um algoritmo genético padrão, que não preserva necessariamente a diversidade das soluções na população final. A hipótese investigada neste trabalho é que a diversidade é importante para gerar árvores de decisão que consigam reproduzir com maior precisão as fronteiras de decisão do classificador localizadas perto do exemplo a ser explicado. Este trabalho mostra que os exemplos artificiais gerados pelos AGs em LORE não são necessariamente diversos. É proposto então o uso da técnica de fitness sharing no AG para gerar exemplos artificiais mais diversos. Consequentemente, as fronteiras de decisão locais da Árvore de Decisão devem ser mais semelhantes aos do classificador caixa-preta. Resultados experimentais com dois classificadores (Perceptron Multicamadas e Florestas Aleatórias) e quatro problemas de classificação indicam que LORE com fitness sharing produz populações de AG mais diversas e melhores explicações locais. |