Uso de web scraping para mineração de produtos e preços em e-commerce
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2022 |
| Tipo de documento: | Trabalho de conclusão de curso |
| Idioma: | por |
| Título da fonte: | Repositório Institucional da UFS |
| Texto Completo: | http://ri.ufs.br/jspui/handle/riufs/17689 |
Resumo: | The development of information and communication technologies has led to the emergence of collaborative systems, such as crowdsourcing, which allows the mutual sharing of data, as diverse as possible, generated by smartphones of a community of users. One of these most popular systems is Waze which allows you to identify congestion-free transit routes using geolocation information from mobile devices. LudiiPrice is a crowdsourcing application that is being developed at UFS under the coordination of the supervisors of this monograph and consists of a price finder for personal consumables and groceries obtained by QR code photographed by smartphones. Invoice data is stored in a database that is used to respond to user queries. The objective of this work is to automatically populate this database using a web crawler to extract price data from products published in e-commerce portals. The data obtained is processed using Natural Language Processing techniques and aims to suggest each item entered through the invoice. The crawler and the suggestions are requested through an API, which was built using the Django framework that uses Python as its language. As a result of the work, crawlers are performed in three e-commerce that populate a base and suggest items extracted from crawler for each product present in the invoice inserted in the LudiiPrice application. |
| id |
UFS-2_23fe3a8346c2a10b2e53aa45d023e00e |
|---|---|
| oai_identifier_str |
oai:oai:ri.ufs.br:repo_01:riufs/17689 |
| network_acronym_str |
UFS-2 |
| network_name_str |
Repositório Institucional da UFS |
| repository_id_str |
|
| spelling |
Oliveira, Wendel LimaMatos, Leonardo NogueiraBispo, Thiago Dias2023-06-06T13:21:28Z2023-06-06T13:21:28Z2022-08-23Oliveira, Wendel Lima. Uso de web scraping para mineração de produtos e preços em e-commerce. São Cristóvão, 2022. Monografia (graduação em Engenharia da Computação) – Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, São Cristóvão, SE, 2022http://ri.ufs.br/jspui/handle/riufs/17689The development of information and communication technologies has led to the emergence of collaborative systems, such as crowdsourcing, which allows the mutual sharing of data, as diverse as possible, generated by smartphones of a community of users. One of these most popular systems is Waze which allows you to identify congestion-free transit routes using geolocation information from mobile devices. LudiiPrice is a crowdsourcing application that is being developed at UFS under the coordination of the supervisors of this monograph and consists of a price finder for personal consumables and groceries obtained by QR code photographed by smartphones. Invoice data is stored in a database that is used to respond to user queries. The objective of this work is to automatically populate this database using a web crawler to extract price data from products published in e-commerce portals. The data obtained is processed using Natural Language Processing techniques and aims to suggest each item entered through the invoice. The crawler and the suggestions are requested through an API, which was built using the Django framework that uses Python as its language. As a result of the work, crawlers are performed in three e-commerce that populate a base and suggest items extracted from crawler for each product present in the invoice inserted in the LudiiPrice application.O desenvolvimento das tecnologias de informação e comunicação propiciou o aparecimento de sistemas colaborativos, como crowdsourcing, que permite o compartilhamento mútuo de dados, os mais diversos possíveis, gerados por smartphones de uma comunidade de usuários. Um destes sistemas mais populares é o Waze que permite identificar rotas de trânsito livres de congestionamento usando informações de geolocalização de aparelhos celulares. O LudiiPrice é um aplicativo crowdsourcing em desenvolvimento na UFS, sob coordenação dos orientadores desta monografia, que consiste em um buscador de preços de produtos de itens de consumo pessoal e gênero alimentício minerados a partir de notas fiscais eletrônicas obtidas pelo código QR fotografado por smartphones. Os dados das notas fiscais são armazenados em uma base de dados, usada para responder às consultas realizadas pelos usuários. O objetivo deste trabalho é realizar o povoamento automático desta base de dados usando um web crawler para extrair dados de preços de itens publicados em portais de e-commerce. Os dados minerados são processados usando técnicas de Processamento de Linguagem Natural e tem como objetivo a sugestão para cada item inserido através da nota fiscal. O crawler e as sugestões são requisitados através de uma API, que foi construída utilizando o framework Django que utiliza Python como linguagem. Como resultado do trabalho os crawlers são realizados em três e-commerce que populam uma base e sugere itens extraídos do crawler para cada produto presente na nota fiscal inserida no aplicativo LudiiPrice.São Cristóvão, SEporEngenharia de computaçãoComputaçãoProcessamento de linguagem naturalE-commerceEngenharia de softwareCrowdsourcingCrawlerNatural language processingCIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWAREUso de web scraping para mineração de produtos e preços em e-commerceinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisUniversidade Federal de Sergipe (UFS)DCOMP - Departamento de Computação – Engenharia de Computação – São Cristóvão - Presencialreponame:Repositório Institucional da UFSinstname:Universidade Federal de Sergipe (UFS)instacron:UFSinfo:eu-repo/semantics/openAccessLICENSElicense.txtlicense.txttext/plain; charset=utf-81475https://ri.ufs.br/jspui/bitstream/riufs/17689/1/license.txt098cbbf65c2c15e1fb2e49c5d306a44cMD51ORIGINALWendel_Lima_Oliveira.pdfWendel_Lima_Oliveira.pdfapplication/pdf1947384https://ri.ufs.br/jspui/bitstream/riufs/17689/2/Wendel_Lima_Oliveira.pdfb31f73b8064473d2567bfac5b68858e1MD52TEXTWendel_Lima_Oliveira.pdf.txtWendel_Lima_Oliveira.pdf.txtExtracted texttext/plain76595https://ri.ufs.br/jspui/bitstream/riufs/17689/3/Wendel_Lima_Oliveira.pdf.txtb267ce2cdb291c76d0c99bf7cb511dc2MD53THUMBNAILWendel_Lima_Oliveira.pdf.jpgWendel_Lima_Oliveira.pdf.jpgGenerated Thumbnailimage/jpeg1345https://ri.ufs.br/jspui/bitstream/riufs/17689/4/Wendel_Lima_Oliveira.pdf.jpg959e5a15727c625b50bd9a8ba87465bbMD54riufs/176892023-06-06 10:21:33.163oai:oai:ri.ufs.br:repo_01:riufs/17689TElDRU7Dh0EgREUgRElTVFJJQlVJw4fDg08gTsODTy1FWENMVVNJVkEKCkNvbSBhIGFwcmVzZW50YcOnw6NvIGRlc3RhIGxpY2Vuw6dhLCB2b2PDqiAobyBhdXRvcihlcykgb3UgbyB0aXR1bGFyIGRvcyBkaXJlaXRvcyBkZSBhdXRvcikgY29uY2VkZSDDoCBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIG8gZGlyZWl0byBuw6NvLWV4Y2x1c2l2byBkZSByZXByb2R1emlyIHNldSB0cmFiYWxobyBubyBmb3JtYXRvIGVsZXRyw7RuaWNvLCBpbmNsdWluZG8gb3MgZm9ybWF0b3Mgw6F1ZGlvIG91IHbDrWRlby4KClZvY8OqIGNvbmNvcmRhIHF1ZSBhIFVuaXZlcnNpZGFkZSBGZWRlcmFsIGRlIFNlcmdpcGUgcG9kZSwgc2VtIGFsdGVyYXIgbyBjb250ZcO6ZG8sIHRyYW5zcG9yIHNldSB0cmFiYWxobyBwYXJhIHF1YWxxdWVyIG1laW8gb3UgZm9ybWF0byBwYXJhIGZpbnMgZGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIHRhbWLDqW0gY29uY29yZGEgcXVlIGEgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBwb2RlIG1hbnRlciBtYWlzIGRlIHVtYSBjw7NwaWEgZGUgc2V1IHRyYWJhbGhvIHBhcmEgZmlucyBkZSBzZWd1cmFuw6dhLCBiYWNrLXVwIGUgcHJlc2VydmHDp8Ojby4KClZvY8OqIGRlY2xhcmEgcXVlIHNldSB0cmFiYWxobyDDqSBvcmlnaW5hbCBlIHF1ZSB2b2PDqiB0ZW0gbyBwb2RlciBkZSBjb25jZWRlciBvcyBkaXJlaXRvcyBjb250aWRvcyBuZXN0YSBsaWNlbsOnYS4gVm9jw6ogdGFtYsOpbSBkZWNsYXJhIHF1ZSBvIGRlcMOzc2l0bywgcXVlIHNlamEgZGUgc2V1IGNvbmhlY2ltZW50bywgbsOjbyBpbmZyaW5nZSBkaXJlaXRvcyBhdXRvcmFpcyBkZSBuaW5ndcOpbS4KCkNhc28gbyB0cmFiYWxobyBjb250ZW5oYSBtYXRlcmlhbCBxdWUgdm9jw6ogbsOjbyBwb3NzdWkgYSB0aXR1bGFyaWRhZGUgZG9zIGRpcmVpdG9zIGF1dG9yYWlzLCB2b2PDqiBkZWNsYXJhIHF1ZSBvYnRldmUgYSBwZXJtaXNzw6NvIGlycmVzdHJpdGEgZG8gZGV0ZW50b3IgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIHBhcmEgY29uY2VkZXIgw6AgVW5pdmVyc2lkYWRlIEZlZGVyYWwgZGUgU2VyZ2lwZSBvcyBkaXJlaXRvcyBhcHJlc2VudGFkb3MgbmVzdGEgbGljZW7Dp2EsIGUgcXVlIGVzc2UgbWF0ZXJpYWwgZGUgcHJvcHJpZWRhZGUgZGUgdGVyY2Vpcm9zIGVzdMOhIGNsYXJhbWVudGUgaWRlbnRpZmljYWRvIGUgcmVjb25oZWNpZG8gbm8gdGV4dG8gb3Ugbm8gY29udGXDumRvLgoKQSBVbml2ZXJzaWRhZGUgRmVkZXJhbCBkZSBTZXJnaXBlIHNlIGNvbXByb21ldGUgYSBpZGVudGlmaWNhciBjbGFyYW1lbnRlIG8gc2V1IG5vbWUocykgb3UgbyhzKSBub21lKHMpIGRvKHMpIApkZXRlbnRvcihlcykgZG9zIGRpcmVpdG9zIGF1dG9yYWlzIGRvIHRyYWJhbGhvLCBlIG7Do28gZmFyw6EgcXVhbHF1ZXIgYWx0ZXJhw6fDo28sIGFsw6ltIGRhcXVlbGFzIGNvbmNlZGlkYXMgcG9yIGVzdGEgbGljZW7Dp2EuIAo=Repositório InstitucionalPUBhttps://ri.ufs.br/oai/requestrepositorio@academico.ufs.bropendoar:2023-06-06T13:21:33Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS)false |
| dc.title.pt_BR.fl_str_mv |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| title |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| spellingShingle |
Uso de web scraping para mineração de produtos e preços em e-commerce Oliveira, Wendel Lima Engenharia de computação Computação Processamento de linguagem natural E-commerce Engenharia de software Crowdsourcing Crawler Natural language processing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE |
| title_short |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| title_full |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| title_fullStr |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| title_full_unstemmed |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| title_sort |
Uso de web scraping para mineração de produtos e preços em e-commerce |
| author |
Oliveira, Wendel Lima |
| author_facet |
Oliveira, Wendel Lima |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Oliveira, Wendel Lima |
| dc.contributor.advisor1.fl_str_mv |
Matos, Leonardo Nogueira |
| dc.contributor.advisor-co1.fl_str_mv |
Bispo, Thiago Dias |
| contributor_str_mv |
Matos, Leonardo Nogueira Bispo, Thiago Dias |
| dc.subject.por.fl_str_mv |
Engenharia de computação Computação Processamento de linguagem natural E-commerce Engenharia de software |
| topic |
Engenharia de computação Computação Processamento de linguagem natural E-commerce Engenharia de software Crowdsourcing Crawler Natural language processing CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE |
| dc.subject.eng.fl_str_mv |
Crowdsourcing Crawler Natural language processing |
| dc.subject.cnpq.fl_str_mv |
CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO::METODOLOGIA E TECNICAS DA COMPUTACAO::ENGENHARIA DE SOFTWARE |
| description |
The development of information and communication technologies has led to the emergence of collaborative systems, such as crowdsourcing, which allows the mutual sharing of data, as diverse as possible, generated by smartphones of a community of users. One of these most popular systems is Waze which allows you to identify congestion-free transit routes using geolocation information from mobile devices. LudiiPrice is a crowdsourcing application that is being developed at UFS under the coordination of the supervisors of this monograph and consists of a price finder for personal consumables and groceries obtained by QR code photographed by smartphones. Invoice data is stored in a database that is used to respond to user queries. The objective of this work is to automatically populate this database using a web crawler to extract price data from products published in e-commerce portals. The data obtained is processed using Natural Language Processing techniques and aims to suggest each item entered through the invoice. The crawler and the suggestions are requested through an API, which was built using the Django framework that uses Python as its language. As a result of the work, crawlers are performed in three e-commerce that populate a base and suggest items extracted from crawler for each product present in the invoice inserted in the LudiiPrice application. |
| publishDate |
2022 |
| dc.date.issued.fl_str_mv |
2022-08-23 |
| dc.date.accessioned.fl_str_mv |
2023-06-06T13:21:28Z |
| dc.date.available.fl_str_mv |
2023-06-06T13:21:28Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.citation.fl_str_mv |
Oliveira, Wendel Lima. Uso de web scraping para mineração de produtos e preços em e-commerce. São Cristóvão, 2022. Monografia (graduação em Engenharia da Computação) – Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, São Cristóvão, SE, 2022 |
| dc.identifier.uri.fl_str_mv |
http://ri.ufs.br/jspui/handle/riufs/17689 |
| identifier_str_mv |
Oliveira, Wendel Lima. Uso de web scraping para mineração de produtos e preços em e-commerce. São Cristóvão, 2022. Monografia (graduação em Engenharia da Computação) – Departamento de Computação, Centro de Ciências Exatas e Tecnologia, Universidade Federal de Sergipe, São Cristóvão, SE, 2022 |
| url |
http://ri.ufs.br/jspui/handle/riufs/17689 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.publisher.initials.fl_str_mv |
Universidade Federal de Sergipe (UFS) |
| dc.publisher.department.fl_str_mv |
DCOMP - Departamento de Computação – Engenharia de Computação – São Cristóvão - Presencial |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UFS instname:Universidade Federal de Sergipe (UFS) instacron:UFS |
| instname_str |
Universidade Federal de Sergipe (UFS) |
| instacron_str |
UFS |
| institution |
UFS |
| reponame_str |
Repositório Institucional da UFS |
| collection |
Repositório Institucional da UFS |
| bitstream.url.fl_str_mv |
https://ri.ufs.br/jspui/bitstream/riufs/17689/1/license.txt https://ri.ufs.br/jspui/bitstream/riufs/17689/2/Wendel_Lima_Oliveira.pdf https://ri.ufs.br/jspui/bitstream/riufs/17689/3/Wendel_Lima_Oliveira.pdf.txt https://ri.ufs.br/jspui/bitstream/riufs/17689/4/Wendel_Lima_Oliveira.pdf.jpg |
| bitstream.checksum.fl_str_mv |
098cbbf65c2c15e1fb2e49c5d306a44c b31f73b8064473d2567bfac5b68858e1 b267ce2cdb291c76d0c99bf7cb511dc2 959e5a15727c625b50bd9a8ba87465bb |
| bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 MD5 |
| repository.name.fl_str_mv |
Repositório Institucional da UFS - Universidade Federal de Sergipe (UFS) |
| repository.mail.fl_str_mv |
repositorio@academico.ufs.br |
| _version_ |
1846687773624369152 |