Comparação de métodos de inferência dos rejeitados em modelos de Credit Scoring

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: SOUZA JÚNIOR, Hélio Gonçalves de
Orientador(a): VASCONCELOS, Germano Crispim
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
Programa de Pós-Graduação: Programa de Pos Graduacao em Ciencia da Computacao
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/50327
Resumo: Os modelos de Credit Scoring têm desempenhado por muitos anos um papel impor- tante na sociedade, contribuindo para a saúde financeira e a oferta de crédito no mercado, com benefícios para credores e tomadores de empréstimos em geral. No entanto, na prática, esses modelos são normalmente construídos numa amostra da população de créditos aprovados e não consideram os clientes que foram rejeitados, causando um viés amostral. A Inferência dos Rejeitados é uma abordagem para estimar como os requerentes de crédito rejeitados teriam se comportado se tivessem sido aprovados, incorporando essas informações na reconstrução do modelo de Credit Scoring. Esta dissertação investiga e compara os métodos considerados estado da arte para inferência dos rejeitados, com dados reais em problemas de larga escala de análise de crédito: Reclassificação, Augmentation, Cluster e Parcelamento. Além disso, pro- põe uma nova abordagem para inferência dos rejeitados com um algoritmo de Deep Learning usado em outras aplicações, o Deep Learning, o Deep Embedded Clustering (DEC), para extração de características dos dados originais. Os métodos são avaliados por diversas métricas de performance, tais como: área sobre a curva ROC, Teste Kolmogorov-Smirnov, F1 score, Acurácia, Diferença entre taxas de inadimplência. Também são empregados o teste não para- métrico de Kruskal-Wallis e o teste post-hoc de Nemenyi para análise da relevância estatística dos resultados. Os métodos são analisados em três conjuntos de dados oriundos de empresas do varejo e mercado financeiro, com diversos perfis de taxa de reprovação. É investigado o quanto a inclusão de parcela dos rejeitados pode impactar em ganhos de performance nos métodos avaliados. Os experimentos realizados evidenciaram que existe diferença significativa entre os métodos estudados e que o método DEC teve desempenho superior que os demais métodos para a maioria das métricas avaliadas.