Mineração visual de dados em notas fiscais do consumidor eletrônicas

Bibliographic Details
Main Author: Lenza, Frederico de Paiva
Publication Date: 2020
Format: Bachelor thesis
Language: por
Source: Biblioteca Digital de Monografias da UnB
Download full: https://bdm.unb.br/handle/10483/27582
Summary: Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.
id UNB-2_45d1833c0e1ae3fdc6875d6e35a898d2
oai_identifier_str oai:bdm.unb.br:10483/27582
network_acronym_str UNB-2
network_name_str Biblioteca Digital de Monografias da UnB
repository_id_str 11571
spelling Lenza, Frederico de PaivaBorges, Vinícius Ruela PereiraLENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020https://bdm.unb.br/handle/10483/27582Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.Uma grande quantidade de notas fiscais de consumidor eletrônicas, associadas às com- pras em estabelecimentos comerciais, atacado e varejo, são geradas diariamente no Brasil. Nos dados das notas fiscais, existem alguns tipos de fraude relacionados com a evasão tributária, que é definida como a total ou parcial intenção de se isentar de pagar um tributo. Esta monografia propõe um processo de visualização exploratória, com o obje- tivo de auxiliar os especialistas em tarefas de auditoria fiscal, visando detectar fraudes e anomalias em dados financeiros. O processo foi formulado de forma que o especialista análise dados financeiros e que possuem atributos de diferentes tipos por meio de visu- alizações baseadas no posicionamento de pontos, considerando três diferentes técnicas de projeção multidimensional: Multidimensional Scaling, Isometric Mapping e t-distributed Stochastic Neighbor Embedding. As fraudes e anomalias nos dados financeiros podem ser identificadas pelo especialista ao interpretar os padrões e as relações de similaridade nas representações gráficas obtidas, como também pode-se manipular os pontos por meio de técnicas de interação, com possibilidade de utilizar algoritmos de agrupamento com a finalidade de enriquecer a análise. Nos experimentos, foram utilizados conjuntos de dados provenientes de notas fiscais do consumidor eletrônicas do Distrito Federal e de compras de cartão de crédito. As representações gráficas produzidas pela técnica de visualização t-SNE apresentaram melhor qualidade em relação às demais, sendo possível identificar as notas fiscais mais similares e que possuem tributação parecida, como também notas fiscais que possuem anomalias e que podem ser indícios de fraude. O processo de visualização exploratória mostrou ser potencialmente útil para auxiliar o especialista no entendimento dos padrões globais e locais nos dados por meio da interação com as representação gráficas obtidas.Submitted by Talles Brendo (170156583@aluno.unb.br) on 2021-05-17T20:29:10Z No. of bitstreams: 1 2020_FredericoDePaivaLenza_tcc.pdf: 2736887 bytes, checksum: d88f9fa5c17189187a7db95bb957d25d (MD5)Approved for entry into archive by Luanna Maia (luanna@bce.unb.br) on 2021-05-18T13:49:22Z (GMT) No. of bitstreams: 1 2020_FredericoDePaivaLenza_tcc.pdf: 2736887 bytes, checksum: d88f9fa5c17189187a7db95bb957d25d (MD5)Made available in DSpace on 2021-05-18T13:49:22Z (GMT). No. of bitstreams: 1 2020_FredericoDePaivaLenza_tcc.pdf: 2736887 bytes, checksum: d88f9fa5c17189187a7db95bb957d25d (MD5)A great quantity of electronic receipts, associated with purchases in commercial estab- lishments, wholesale and retail, are generated daily in Brazil. There are some types of fraudulent behaviors related to electronic receipts, these behaviors are defined as the total or partial intention of exempting yourself from paying a tribute. This study proposes a visual exploration process aiming at supporting specialists in the task detecting frauds and anomalies in transactional data. The process was created in a way that enables the specialist to visualize transactional data that present attributes of different types us- ing multidimensional projection algorithms, such as Multidimensional Scaling, Isometric Mapping and t-distributed Stochastic Neighbor Embedding. Anomalies in transactional data can be identified by the specialist when interpreting patterns and similarity relation- ships embedded in the obtained graphical layouts. The layouts can also be manipulated to a certain degree with the usage of techniques such as zoom and filter. Optionally, the layout can also be clustered to reveal hidden patterns found by unsupervised machine learning algorithms. The datasets used in the experiments were from the electronic tax invoice data gathered in the Federal District and a German credit card dataset. The graphical representations generated through t-SNE had the best quality from the other techniques utilized, being possible to identify data clustered together with similar data as well as potential evidence of anomalies. The visual exploration process showed to be useful to support the specialist in understading the global and local data patterns by means of interactive resources with the obtained layouts.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessNotas fiscaisMineração de dadosProcessamento eletrônico de dadosMineração visual de dados em notas fiscais do consumidor eletrônicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2021-05-18T13:49:22Z2021-05-18T13:49:22Z2020-12-11porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/27582/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2020_FredericoDePaivaLenza_tcc.pdf2020_FredericoDePaivaLenza_tcc.pdfapplication/pdf2736887http://bdm.unb.br/xmlui/bitstream/10483/27582/1/2020_FredericoDePaivaLenza_tcc.pdfd88f9fa5c17189187a7db95bb957d25dMD5110483/275822021-05-18 10:49:22.839oai:bdm.unb.br:10483/27582w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712021-05-18T13:49:22Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false
dc.title.pt_BR.fl_str_mv Mineração visual de dados em notas fiscais do consumidor eletrônicas
title Mineração visual de dados em notas fiscais do consumidor eletrônicas
spellingShingle Mineração visual de dados em notas fiscais do consumidor eletrônicas
Lenza, Frederico de Paiva
Notas fiscais
Mineração de dados
Processamento eletrônico de dados
title_short Mineração visual de dados em notas fiscais do consumidor eletrônicas
title_full Mineração visual de dados em notas fiscais do consumidor eletrônicas
title_fullStr Mineração visual de dados em notas fiscais do consumidor eletrônicas
title_full_unstemmed Mineração visual de dados em notas fiscais do consumidor eletrônicas
title_sort Mineração visual de dados em notas fiscais do consumidor eletrônicas
author Lenza, Frederico de Paiva
author_facet Lenza, Frederico de Paiva
author_role author
dc.contributor.author.fl_str_mv Lenza, Frederico de Paiva
dc.contributor.advisor1.fl_str_mv Borges, Vinícius Ruela Pereira
contributor_str_mv Borges, Vinícius Ruela Pereira
dc.subject.keyword.pt_BR.fl_str_mv Notas fiscais
Mineração de dados
Processamento eletrônico de dados
topic Notas fiscais
Mineração de dados
Processamento eletrônico de dados
description Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.
publishDate 2020
dc.date.submitted.none.fl_str_mv 2020-12-11
dc.date.accessioned.fl_str_mv 2021-05-18T13:49:22Z
dc.date.available.fl_str_mv 2021-05-18T13:49:22Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.citation.fl_str_mv LENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020
dc.identifier.uri.fl_str_mv https://bdm.unb.br/handle/10483/27582
identifier_str_mv LENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020
url https://bdm.unb.br/handle/10483/27582
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.source.none.fl_str_mv reponame:Biblioteca Digital de Monografias da UnB
instname:Universidade de Brasília (UnB)
instacron:UNB
instname_str Universidade de Brasília (UnB)
instacron_str UNB
institution UNB
reponame_str Biblioteca Digital de Monografias da UnB
collection Biblioteca Digital de Monografias da UnB
bitstream.url.fl_str_mv http://bdm.unb.br/xmlui/bitstream/10483/27582/2/license.txt
http://bdm.unb.br/xmlui/bitstream/10483/27582/1/2020_FredericoDePaivaLenza_tcc.pdf
bitstream.checksum.fl_str_mv 21554873e56ad8ddc69c092699b98f95
d88f9fa5c17189187a7db95bb957d25d
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
repository.name.fl_str_mv Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)
repository.mail.fl_str_mv bdm@bce.unb.br||patricia@bce.unb.br
_version_ 1839084970379837440