O uso da aprendizagem de máquina para a criação de modelos preditivos de evasão de cotistas no mercado de fundos de investimentos

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: Xavier, Eric Carvalhal
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.idp.edu.br//handle/123456789/4193
Resumo: O objetivo desse trabalho foi identificar a existência de variáveis comportamentais de cotistas de fundos de investimento que pudessem ajudar a explicar o encerramento de relacionamento com o banco e buscar modelos com a melhor performance preditora de evasão. A metodologia utilizou a pesquisa aplicada para gerar conhecimentos de aplicação prática com a abordagem quantitativa. O procedimento adotado foi por meio da pesquisa empírica a base de dados de uma instituição financeira do Brasil. Para garantir o atendimento à Lei 13.709 de 14 de agosto de 2018, todas as informações pessoais foram descaracterizadas e não disponibilizadas durante o processo de pesquisa, análise de dados e desenvolvimento dos modelos preditivos para a aprendizagem de máquinas. A população totalizou 2.907.270 clientes pessoas físicas dos segmentos de média a alta renda e amostra balanceada com a técnica under sampling de 200.000 clientes. As principais variáveis identificadas como importantes na predição da evasão foram a posse de produtos, saldo, perfil digital, dentre outras. Foi realizada a comparação de performance em relação a curva ROC para os modelos Regressão Logística, Árvore de Decisão, KNN, Naive Bayes, Randon Forest, XGBoost, LDA, MLP e SVC, e os resultados apontaram o XGBoost como o modelo de melhor performance preditiva com curva ROC de 0,7861 e matriz de confusão com acurácia de 71,16.