Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro

Bibliographic Details
Main Author: Cristovão, Rafael Belmiro
Publication Date: 2023
Format: Master thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da USP
Download full: https://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082023-102023/
Summary: As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.
id USP_569a653f81dc7ee4e28d3fb47189d1ba
oai_identifier_str oai:teses.usp.br:tde-23082023-102023
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiroCredit card fraud detection: a case study of supervised models in brazilian e-commerceCartão de créditoCompra onlineCredit cardDetecção de fraudeEcommerceEcommerceFraudFraud detectionFraudeOnline purchaseAs tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.Fraud has grown significantly with the development of new communication technologies and the processes digitalization, resulting in huge financial losses for institutions. Consequently, fraud detection and prevention methods are important topics to explore. Credit card fraud is one of the most frequent type of fraud due to the popularization of online shopping, ease of using third party credit cards and the lack of validation layers, such as password and chip verification, which are commonly used in face-to-face purchases. Many different techniques for extracting features and machine learning algorithms are used to create fraud prevention and detection models. The need to quickly adapt to new types of fraud, unbalanced distributions and the delay in obtaining information on fraudulent transactions are some of the challenges that fraud prevention models must deal with. In this work, we use a real Brazilian e-commerce databaset to compare different machine learning algorithms and study the online learning approach as an alternative to deal with concept drift. The experiments showed that the decision tree based algorithms performed better and the Gradient Boosting Decision Tree was the best. Moreover, the comparison of different learning strategies revealed that the online learning approach improved the algorithms performance in the presence of concept drift, reducing by up to 30% the losses with chargebacks.Biblioteca Digitais de Teses e Dissertações da USPBuscaglia, Gustavo CarlosCristovão, Rafael Belmiro2023-03-31info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082023-102023/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2023-08-23T13:28:02Zoai:teses.usp.br:tde-23082023-102023Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212023-08-23T13:28:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
Credit card fraud detection: a case study of supervised models in brazilian e-commerce
title Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
spellingShingle Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
Cristovão, Rafael Belmiro
Cartão de crédito
Compra online
Credit card
Detecção de fraude
Ecommerce
Ecommerce
Fraud
Fraud detection
Fraude
Online purchase
title_short Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_full Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_fullStr Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_full_unstemmed Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
title_sort Detecção de fraudes em cartão de crédito: um caso de uso de modelos supervisionados no e-commerce brasileiro
author Cristovão, Rafael Belmiro
author_facet Cristovão, Rafael Belmiro
author_role author
dc.contributor.none.fl_str_mv Buscaglia, Gustavo Carlos
dc.contributor.author.fl_str_mv Cristovão, Rafael Belmiro
dc.subject.por.fl_str_mv Cartão de crédito
Compra online
Credit card
Detecção de fraude
Ecommerce
Ecommerce
Fraud
Fraud detection
Fraude
Online purchase
topic Cartão de crédito
Compra online
Credit card
Detecção de fraude
Ecommerce
Ecommerce
Fraud
Fraud detection
Fraude
Online purchase
description As tentativas de fraude têm crescido com a chegada de novas tecnologias de comunicação e a digitalização de processos, resultando em grandes perdas financeiras para as instituições. Consequentemente, os métodos de detecção e prevenção de fraudes se tornaram um importante tema a ser explorado. A fraude de cartão de crédito é uma das formas mais populares de fraude devido à disseminação das compras online, facilidade de utilização de cartões de crédito de terceiros e falta de camadas de validação, como senhas e chips, que acontecem na maioria das compras presenciais. Muitas técnicas diferentes de extração de variáveis e aprendizado de máquina são utilizadas na criação de modelos de prevenção e detecção à fraude. A necessidade de rápida adaptação às mudanças de comportamento, distribuições desbalanceadas e a demora na obtenção da informação de transações fraudulentas são alguns dos desafios que os modelos de prevenção de fraudes devem lidar. Neste trabalho comparamos diferentes modelos de aprendizado de máquina utilizando-se de uma base de transações reais de uma loja do comércio eletrônico brasileiro, aplicando diversos algoritmos de previsão para comparação de desempenho. Além disso, estudamos o impacto de uma abordagem de aprendizado online como alternativa à queda de performance na presença de concept drift. Os experimentos desenvolvidos mostraram que os algoritmos baseados em árvores de decisão possuem os melhores desempenhos na base estudada, sendo o Gradient Boosting Decision Tree o algoritmo com melhor resultado. A partir da comparação dos cenários de aprendizado, foi possível identificar que a atualização com lotes semanais melhora o desempenho do algoritmo ao longo do tempo, sendo capaz de reduzir em até 30% os gastos com chargeback na presença de concept drift.
publishDate 2023
dc.date.none.fl_str_mv 2023-03-31
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082023-102023/
url https://www.teses.usp.br/teses/disponiveis/55/55137/tde-23082023-102023/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1826319048838742016