Mineração visual de dados em notas fiscais do consumidor eletrônicas
| Main Author: | |
|---|---|
| Publication Date: | 2020 |
| Format: | Bachelor thesis |
| Language: | por |
| Source: | Biblioteca Digital de Monografias da UnB |
| Download full: | https://bdm.unb.br/handle/10483/27582 |
Summary: | Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020. |
| id |
UNB-2_45d1833c0e1ae3fdc6875d6e35a898d2 |
|---|---|
| oai_identifier_str |
oai:bdm.unb.br:10483/27582 |
| network_acronym_str |
UNB-2 |
| network_name_str |
Biblioteca Digital de Monografias da UnB |
| repository_id_str |
11571 |
| spelling |
Lenza, Frederico de PaivaBorges, Vinícius Ruela PereiraLENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020https://bdm.unb.br/handle/10483/27582Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020.Uma grande quantidade de notas fiscais de consumidor eletrônicas, associadas às com- pras em estabelecimentos comerciais, atacado e varejo, são geradas diariamente no Brasil. Nos dados das notas fiscais, existem alguns tipos de fraude relacionados com a evasão tributária, que é definida como a total ou parcial intenção de se isentar de pagar um tributo. Esta monografia propõe um processo de visualização exploratória, com o obje- tivo de auxiliar os especialistas em tarefas de auditoria fiscal, visando detectar fraudes e anomalias em dados financeiros. O processo foi formulado de forma que o especialista análise dados financeiros e que possuem atributos de diferentes tipos por meio de visu- alizações baseadas no posicionamento de pontos, considerando três diferentes técnicas de projeção multidimensional: Multidimensional Scaling, Isometric Mapping e t-distributed Stochastic Neighbor Embedding. As fraudes e anomalias nos dados financeiros podem ser identificadas pelo especialista ao interpretar os padrões e as relações de similaridade nas representações gráficas obtidas, como também pode-se manipular os pontos por meio de técnicas de interação, com possibilidade de utilizar algoritmos de agrupamento com a finalidade de enriquecer a análise. Nos experimentos, foram utilizados conjuntos de dados provenientes de notas fiscais do consumidor eletrônicas do Distrito Federal e de compras de cartão de crédito. As representações gráficas produzidas pela técnica de visualização t-SNE apresentaram melhor qualidade em relação às demais, sendo possível identificar as notas fiscais mais similares e que possuem tributação parecida, como também notas fiscais que possuem anomalias e que podem ser indícios de fraude. O processo de visualização exploratória mostrou ser potencialmente útil para auxiliar o especialista no entendimento dos padrões globais e locais nos dados por meio da interação com as representação gráficas obtidas.Submitted by Talles Brendo (170156583@aluno.unb.br) on 2021-05-17T20:29:10Z No. of bitstreams: 1 2020_FredericoDePaivaLenza_tcc.pdf: 2736887 bytes, checksum: d88f9fa5c17189187a7db95bb957d25d (MD5)Approved for entry into archive by Luanna Maia (luanna@bce.unb.br) on 2021-05-18T13:49:22Z (GMT) No. of bitstreams: 1 2020_FredericoDePaivaLenza_tcc.pdf: 2736887 bytes, checksum: d88f9fa5c17189187a7db95bb957d25d (MD5)Made available in DSpace on 2021-05-18T13:49:22Z (GMT). No. of bitstreams: 1 2020_FredericoDePaivaLenza_tcc.pdf: 2736887 bytes, checksum: d88f9fa5c17189187a7db95bb957d25d (MD5)A great quantity of electronic receipts, associated with purchases in commercial estab- lishments, wholesale and retail, are generated daily in Brazil. There are some types of fraudulent behaviors related to electronic receipts, these behaviors are defined as the total or partial intention of exempting yourself from paying a tribute. This study proposes a visual exploration process aiming at supporting specialists in the task detecting frauds and anomalies in transactional data. The process was created in a way that enables the specialist to visualize transactional data that present attributes of different types us- ing multidimensional projection algorithms, such as Multidimensional Scaling, Isometric Mapping and t-distributed Stochastic Neighbor Embedding. Anomalies in transactional data can be identified by the specialist when interpreting patterns and similarity relation- ships embedded in the obtained graphical layouts. The layouts can also be manipulated to a certain degree with the usage of techniques such as zoom and filter. Optionally, the layout can also be clustered to reveal hidden patterns found by unsupervised machine learning algorithms. The datasets used in the experiments were from the electronic tax invoice data gathered in the Federal District and a German credit card dataset. The graphical representations generated through t-SNE had the best quality from the other techniques utilized, being possible to identify data clustered together with similar data as well as potential evidence of anomalies. The visual exploration process showed to be useful to support the specialist in understading the global and local data patterns by means of interactive resources with the obtained layouts.A concessão da licença deste item refere-se ao termo de autorização impresso assinado pelo autor que autoriza a Biblioteca Digital da Produção Intelectual Discente da Universidade de Brasília (BDM) a disponibilizar o trabalho de conclusão de curso por meio do sítio bdm.unb.br, com as seguintes condições: disponível sob Licença Creative Commons 4.0 International, que permite copiar, distribuir e transmitir o trabalho, desde que seja citado o autor e licenciante. Não permite o uso para fins comerciais nem a adaptação desta.info:eu-repo/semantics/openAccessNotas fiscaisMineração de dadosProcessamento eletrônico de dadosMineração visual de dados em notas fiscais do consumidor eletrônicasinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesis2021-05-18T13:49:22Z2021-05-18T13:49:22Z2020-12-11porreponame:Biblioteca Digital de Monografias da UnBinstname:Universidade de Brasília (UnB)instacron:UNBLICENSElicense.txtlicense.txttext/plain1817http://bdm.unb.br/xmlui/bitstream/10483/27582/2/license.txt21554873e56ad8ddc69c092699b98f95MD52ORIGINAL2020_FredericoDePaivaLenza_tcc.pdf2020_FredericoDePaivaLenza_tcc.pdfapplication/pdf2736887http://bdm.unb.br/xmlui/bitstream/10483/27582/1/2020_FredericoDePaivaLenza_tcc.pdfd88f9fa5c17189187a7db95bb957d25dMD5110483/275822021-05-18 10:49:22.839oai:bdm.unb.br:10483/27582w4kgbmVjZXNzw6FyaW8gY29uY29yZGFyIGNvbSBhIGxpY2Vuw6dhIGRlIGRpc3RyaWJ1acOnw6NvIG7Do28tZXhjbHVzaXZhLAphbnRlcyBxdWUgbyBkb2N1bWVudG8gcG9zc2EgYXBhcmVjZXIgbmEgQmlibGlvdGVjYSBEaWdpdGFsIGRhIFByb2R1w6fDo28gCkRpc2NlbnRlIGRhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEuIFBvciBmYXZvciwgbGVpYSBhCmxpY2Vuw6dhIGF0ZW50YW1lbnRlLiBDYXNvIG5lY2Vzc2l0ZSBkZSBhbGd1bSBlc2NsYXJlY2ltZW50byBlbnRyZSBlbQpjb250YXRvIGF0cmF2w6lzIGRlOiBiZG1AYmNlLnVuYi5iciBvdSAzMTA3LTI2ODcuCgpMSUNFTsOHQSBERSBESVNUUklCVUnDh8ODTyBOw4NPLUVYQ0xVU0lWQQoKQW8gYXNzaW5hciBlIGVudHJlZ2FyIGVzdGEgbGljZW7Dp2EsIG8vYSBTci4vU3JhLiAoYXV0b3Igb3UgZGV0ZW50b3IgZG9zCmRpcmVpdG9zIGRlIGF1dG9yKToKCmEpIENvbmNlZGUgw6AgVW5pdmVyc2lkYWRlIGRlIEJyYXPDrWxpYSBvIGRpcmVpdG8gbsOjby1leGNsdXNpdm8gZGUKcmVwcm9kdXppciwgY29udmVydGVyIChjb21vIGRlZmluaWRvIGFiYWl4byksIGNvbXVuaWNhciBlL291CmRpc3RyaWJ1aXIgbyBkb2N1bWVudG8gZW50cmVndWUgKGluY2x1aW5kbyBvIHJlc3Vtby9hYnN0cmFjdCkgZW0KZm9ybWF0byBkaWdpdGFsIG91IGltcHJlc3NvIGUgZW0gcXVhbHF1ZXIgbWVpby4KCmIpIERlY2xhcmEgcXVlIG8gZG9jdW1lbnRvIGVudHJlZ3VlIMOpIHNldSB0cmFiYWxobyBvcmlnaW5hbCwgZSBxdWUKZGV0w6ltIG8gZGlyZWl0byBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gRGVjbGFyYQp0YW1iw6ltIHF1ZSBhIGVudHJlZ2EgZG8gZG9jdW1lbnRvIG7Do28gaW5mcmluZ2UsIHRhbnRvIHF1YW50byBsaGUgw6kKcG9zc8OtdmVsIHNhYmVyLCBvcyBkaXJlaXRvcyBkZSBxdWFscXVlciBvdXRyYSBwZXNzb2Egb3UgZW50aWRhZGUuCgpjKSBTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSBjb250w6ltIG1hdGVyaWFsIGRvIHF1YWwgbsOjbyBkZXTDqW0gb3MKZGlyZWl0b3MgZGUgYXV0b3IsIGRlY2xhcmEgcXVlIG9idGV2ZSBhdXRvcml6YcOnw6NvIGRvIGRldGVudG9yIGRvcwpkaXJlaXRvcyBkZSBhdXRvciBwYXJhIGNvbmNlZGVyIMOgIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEgb3MgZGlyZWl0b3MKcmVxdWVyaWRvcyBwb3IgZXN0YSBsaWNlbsOnYSwgZSBxdWUgZXNzZSBtYXRlcmlhbCBjdWpvcyBkaXJlaXRvcyBzw6NvIGRlCnRlcmNlaXJvcyBlc3TDoSBjbGFyYW1lbnRlIGlkZW50aWZpY2FkbyBlIHJlY29uaGVjaWRvIG5vIHRleHRvIG91CmNvbnRlw7pkbyBkbyBkb2N1bWVudG8gZW50cmVndWUuCgpTZSBvIGRvY3VtZW50byBlbnRyZWd1ZSDDqSBiYXNlYWRvIGVtIHRyYWJhbGhvIGZpbmFuY2lhZG8gb3UgYXBvaWFkbwpwb3Igb3V0cmEgaW5zdGl0dWnDp8OjbyBxdWUgbsOjbyBhIFVuaXZlcnNpZGFkZSBkZSBCcmFzw61saWEsIGRlY2xhcmEgcXVlCmN1bXByaXUgcXVhaXNxdWVyIG9icmlnYcOnw7VlcyBleGlnaWRhcyBwZWxvIHJlc3BlY3Rpdm8gY29udHJhdG8gb3UKYWNvcmRvLgoKQSBVbml2ZXJzaWRhZGUgZGUgQnJhc8OtbGlhIGlkZW50aWZpY2Fyw6EgY2xhcmFtZW50ZSBvKHMpIHNldSAocykgbm9tZSAocykKY29tbyBvIChzKSBhdXRvciAoZXMpIG91IGRldGVudG9yIChlcykgZG9zIGRpcmVpdG9zIGRvIGRvY3VtZW50bwplbnRyZWd1ZSwgZSBuw6NvIGZhcsOhIHF1YWxxdWVyIGFsdGVyYcOnw6NvLCBwYXJhIGFsw6ltIGRhcyBwZXJtaXRpZGFzIHBvcgplc3RhIGxpY2Vuw6dhLgo=Biblioteca Digital de Monografiahttps://bdm.unb.br/PUBhttp://bdm.unb.br/oai/requestbdm@bce.unb.br||patricia@bce.unb.bropendoar:115712021-05-18T13:49:22Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB)false |
| dc.title.pt_BR.fl_str_mv |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| title |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| spellingShingle |
Mineração visual de dados em notas fiscais do consumidor eletrônicas Lenza, Frederico de Paiva Notas fiscais Mineração de dados Processamento eletrônico de dados |
| title_short |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| title_full |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| title_fullStr |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| title_full_unstemmed |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| title_sort |
Mineração visual de dados em notas fiscais do consumidor eletrônicas |
| author |
Lenza, Frederico de Paiva |
| author_facet |
Lenza, Frederico de Paiva |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Lenza, Frederico de Paiva |
| dc.contributor.advisor1.fl_str_mv |
Borges, Vinícius Ruela Pereira |
| contributor_str_mv |
Borges, Vinícius Ruela Pereira |
| dc.subject.keyword.pt_BR.fl_str_mv |
Notas fiscais Mineração de dados Processamento eletrônico de dados |
| topic |
Notas fiscais Mineração de dados Processamento eletrônico de dados |
| description |
Trabalho de conclusão de curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2020. |
| publishDate |
2020 |
| dc.date.submitted.none.fl_str_mv |
2020-12-11 |
| dc.date.accessioned.fl_str_mv |
2021-05-18T13:49:22Z |
| dc.date.available.fl_str_mv |
2021-05-18T13:49:22Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
LENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020 |
| dc.identifier.uri.fl_str_mv |
https://bdm.unb.br/handle/10483/27582 |
| identifier_str_mv |
LENZA, Frederico de Paiva. Mineração visual de dados em notas fiscais do consumidor eletrônicas. 2020. 68 f., il. Trabalho de conclusão de curso (Bacharelado em Ciência da Computação)—Universidade de Brasília, Brasília, 2020 |
| url |
https://bdm.unb.br/handle/10483/27582 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Monografias da UnB instname:Universidade de Brasília (UnB) instacron:UNB |
| instname_str |
Universidade de Brasília (UnB) |
| instacron_str |
UNB |
| institution |
UNB |
| reponame_str |
Biblioteca Digital de Monografias da UnB |
| collection |
Biblioteca Digital de Monografias da UnB |
| bitstream.url.fl_str_mv |
http://bdm.unb.br/xmlui/bitstream/10483/27582/2/license.txt http://bdm.unb.br/xmlui/bitstream/10483/27582/1/2020_FredericoDePaivaLenza_tcc.pdf |
| bitstream.checksum.fl_str_mv |
21554873e56ad8ddc69c092699b98f95 d88f9fa5c17189187a7db95bb957d25d |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 |
| repository.name.fl_str_mv |
Biblioteca Digital de Monografias da UnB - Universidade de Brasília (UnB) |
| repository.mail.fl_str_mv |
bdm@bce.unb.br||patricia@bce.unb.br |
| _version_ |
1839084970379837440 |