Técnicas de interpretabilidade para aprendizado de máquina: um estudo abordando avaliação de crédito e detecção de fraude

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Caires, Daniel de Oliveira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-16122022-180337/
Resumo: Atualmente técnicas de aprendizado de máquina vêm sendo constantemente utilizadas para apoiar no processo de tomada de decisões importantes para indivíduos e corporações. Com o peso dessas decisões, surgem também inúmeras preocupações relativas ao seu funcionamento, quais condições foram necessárias para levar aos resultados obtidos, ou até se possíveis erros ou vieses não interferiram. Por esse motivo, a interpretabilidade das técnicas de aprendizado de máquina é um tema cuja relevância cresce a cada dia. O objetivo dessa dissertação é avaliar as principais técnicas de interpretabilidade, para isso, aplicando-as em modelos preditivos de classificação em bases de dados reais, uma relacionada a concessão de crédito e outra sobre detecção de fraude. Dentre as técnicas avaliadas estão: Gráfico de Dependência Parcial, Permutação de Atributo de Importância, Importância de Atributo e SHAP (SHapley Additive exPlanations). Do ponto de vista metodológico, para cada base de dados foi desenvolvido um modelo preditivo e posteriormente as técnicas de interpretabilidade foram aplicadas. Os resultados mostraram que as técnicas conseguiram trazer mais entendimento sobre quais variáveis tiveram maior impacto para seu respectivo modelo, e até avaliar individualmente um consumidor, quantificando quanto cada variável contribuiu para a sua classificação final. Nesse sentido o SHAP se destacou sendo a técnica que trouxe maior variedade e qualidade de informações que contribuíram para se atingir avanço na interpretabilidade.