Aplicação de Redes Bayesianas em modelos de classificação de risco de crédito

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Fernandes, Luís Felipe Barbosa
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://www.teses.usp.br/teses/disponiveis/96/96132/tde-09082019-110750/
Resumo: A demanda pelo estudo e aprimoramento de modelos de crédito que auxiliem na tomada de decisões, relativas a concessão creditícia, cresce de forma acelerada. Frente às dificuldades de ordem financeira que atingem os mais diversos países, incluindo o Brasil, verifica-se uma crescente preocupação dos órgãos reguladores do mercado financeiro, bem como, das próprias instituições credoras que atuam no mercado por modelos de crédito. A dificuldade para a obtenção de informações que reflitam a saúde financeira das empresas - assimetria informacional - aliada à carência de informações no mercado financeiro contribui para o aumento dos casos de default e empresas que decretam concordata. Em face dos problemas e dificuldades apresentados, a pesquisa empregou o método probabilístico de Redes Bayesianas com o objetivo de desenvolver um modelo de crédito que calcule o risco de crédito de uma empresa baseado apenas em um conjunto de indicadores financeiros, obtidos a partir das demonstrações financeiras dessas empresas. Para isso, foi usado um conjunto de demonstrações financeiras, referentes a um total de 852 empresas com faturamento superior à 200 milhões, cedidas pela instituição Serasa Experian. A partir dessas demonstrações foram implementadas as fórmulas usadas pela Serasa Experian para o cálculo de indicadores financeiros, a partir dos quais a Rede Bayesiana inicial foi formada. A técnica de Redes foi implementada através do algoritmo denominado Algoritmo Pc, que combina elementos de grafos probabilísticos e definições de probabilidades condicionais, para a selecionar as variáveis, representadas pelos indicadores financeiros, mais significantes para o cálculo do risco de crédito. Além disso, foi realizada uma comparação da técnica probabilística de Redes Bayesianas com a técnica de Regressão Logística, para verificar qual dos modelos melhor se adequava ao conjunto de dados. Após implementar a técnica, foi desenvolvido também um aplicativo, que calcula o risco de crédito de uma empresa, a partir de um conjunto de 17 indicadores financeiros e exibe ao usuário final, a classe de risco, dentre cada uma das 13 classes possíveis, a que uma empresa possui maior probabilidade de pertencer. Para validar a técnica de Redes Bayesianas foram empregadas duas métricas: a RMSE(Raiz Quadrada do Erro Médio) e o MAE(Erro Absoluto Médio). As métricas mostraram que o modelo de Redes Bayesianas foi pouco preditivo, com resultados aquém do esperado. Os resultados da técnica de Regressão Logística porém, mostram um percentual de acertos muito superior, classificando um percentual de 82% das empresas classificadas como de risco de crédito baixo, de forma correta