Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2019 |
| Tipo de documento: | Dissertação |
| Idioma: | por |
| Título da fonte: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Texto Completo: | http://hdl.handle.net/10400.26/37552 |
Resumo: | Hoje em dia, a população encontra-se sobrecarregada com dados, quando todas as atividades realizadas pelas organizações e pessoas, no seu dia-a-dia, geram dados. Contudo, o facto de termos acesso a um enorme volume de dados não significa que tenhamos acesso a muita informação ou conhecimento. É, portanto, importante trabalhar os dados por forma a gerar informação relevante para a tomada de decisão, pois num mundo globalizado e extremamente competitivo, um minuto pode ser fulcral para fechar um negócio e, para tal, é necessário ter acesso à informação atual, correta e sumarizada. Face ao volume de dados existente e a necessidade de criar vantagens competitivas para as empresas sobreviverem nos seus mercados importa analisar os dados por forma a identificar informação que poderia estar oculta ou padrões nos comportamentos dos consumidores. É aqui que entra o data mining, cujo principal objetivo é analisar os dados e encontrar anomalias, padrões ou novas informações que auxiliem na tomada de decisão. O setor do retalho é um dos setores que mais valor monetário gera mundialmente e um dos setores onde a concorrência é mais feroz, pelo que quanto mais conhecimento e informações as empresas tiverem ao seu dispor maior será a probabilidade de conseguirem adquirir vantagens competitivas. Nesta procura de informação temos como exemplo as regras de associação, uma técnica de data mining cujo objetivo é encontrar itens que ocorrem frequentemente e em conjunto nos cestos de compras dos clientes. Um dos algoritmos concebidos para a geração de regras de associação é o algoritmo Apriori em que a sua génese foi baseada na análise de compras efetuadas num supermercado. Ao aplicar algoritmos para obter regras de associação ao setor do retalho é comum indicar- se que se usou uma técnica de market basket analysis. Este trabalho tem como principais objetivos a análise exploratória de um dataset público com um grande conjunto de compras (Instacart) e a geração de regras de associação recorrendo à utilização do algoritmo Apriori. Consoante os resultados obtidos serão sugeridas ideias para implementar novas estratégia de marketing. Este trabalho iniciou-se com a revisão da literatura, investigando os conceitos de data mining, regras de associação e market basket analysis. Como bússola orientadora para a aplicação de técnicas de data mining seguiu-se a metodologia CRISP. Para a análise exploratória dos dados foi utilizado o software Power BI e para a transformação dos dados e aplicação do algoritmo Apriori e consequentemente a geração das regras de associação recorreu-se à linguagem Python. |
| id |
RCAP_079a23322ebb1b7da933c813c9bf8c06 |
|---|---|
| oai_identifier_str |
oai:comum.rcaap.pt:10400.26/37552 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset públicoData MiningRegras de AssociaçãoAlgoritmo AprioriAssociation RulesApriori AlgorithmHoje em dia, a população encontra-se sobrecarregada com dados, quando todas as atividades realizadas pelas organizações e pessoas, no seu dia-a-dia, geram dados. Contudo, o facto de termos acesso a um enorme volume de dados não significa que tenhamos acesso a muita informação ou conhecimento. É, portanto, importante trabalhar os dados por forma a gerar informação relevante para a tomada de decisão, pois num mundo globalizado e extremamente competitivo, um minuto pode ser fulcral para fechar um negócio e, para tal, é necessário ter acesso à informação atual, correta e sumarizada. Face ao volume de dados existente e a necessidade de criar vantagens competitivas para as empresas sobreviverem nos seus mercados importa analisar os dados por forma a identificar informação que poderia estar oculta ou padrões nos comportamentos dos consumidores. É aqui que entra o data mining, cujo principal objetivo é analisar os dados e encontrar anomalias, padrões ou novas informações que auxiliem na tomada de decisão. O setor do retalho é um dos setores que mais valor monetário gera mundialmente e um dos setores onde a concorrência é mais feroz, pelo que quanto mais conhecimento e informações as empresas tiverem ao seu dispor maior será a probabilidade de conseguirem adquirir vantagens competitivas. Nesta procura de informação temos como exemplo as regras de associação, uma técnica de data mining cujo objetivo é encontrar itens que ocorrem frequentemente e em conjunto nos cestos de compras dos clientes. Um dos algoritmos concebidos para a geração de regras de associação é o algoritmo Apriori em que a sua génese foi baseada na análise de compras efetuadas num supermercado. Ao aplicar algoritmos para obter regras de associação ao setor do retalho é comum indicar- se que se usou uma técnica de market basket analysis. Este trabalho tem como principais objetivos a análise exploratória de um dataset público com um grande conjunto de compras (Instacart) e a geração de regras de associação recorrendo à utilização do algoritmo Apriori. Consoante os resultados obtidos serão sugeridas ideias para implementar novas estratégia de marketing. Este trabalho iniciou-se com a revisão da literatura, investigando os conceitos de data mining, regras de associação e market basket analysis. Como bússola orientadora para a aplicação de técnicas de data mining seguiu-se a metodologia CRISP. Para a análise exploratória dos dados foi utilizado o software Power BI e para a transformação dos dados e aplicação do algoritmo Apriori e consequentemente a geração das regras de associação recorreu-se à linguagem Python.Barbosa, VictorRepositório ComumOliveira, Joana Raquel Carias de2021-09-23T13:54:21Z2019-122019-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/37552urn:tid:202365778porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-05-02T16:32:12Zoai:comum.rcaap.pt:10400.26/37552Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T06:54:00.044824Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| title |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| spellingShingle |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público Oliveira, Joana Raquel Carias de Data Mining Regras de Associação Algoritmo Apriori Association Rules Apriori Algorithm |
| title_short |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| title_full |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| title_fullStr |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| title_full_unstemmed |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| title_sort |
Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público |
| author |
Oliveira, Joana Raquel Carias de |
| author_facet |
Oliveira, Joana Raquel Carias de |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Barbosa, Victor Repositório Comum |
| dc.contributor.author.fl_str_mv |
Oliveira, Joana Raquel Carias de |
| dc.subject.por.fl_str_mv |
Data Mining Regras de Associação Algoritmo Apriori Association Rules Apriori Algorithm |
| topic |
Data Mining Regras de Associação Algoritmo Apriori Association Rules Apriori Algorithm |
| description |
Hoje em dia, a população encontra-se sobrecarregada com dados, quando todas as atividades realizadas pelas organizações e pessoas, no seu dia-a-dia, geram dados. Contudo, o facto de termos acesso a um enorme volume de dados não significa que tenhamos acesso a muita informação ou conhecimento. É, portanto, importante trabalhar os dados por forma a gerar informação relevante para a tomada de decisão, pois num mundo globalizado e extremamente competitivo, um minuto pode ser fulcral para fechar um negócio e, para tal, é necessário ter acesso à informação atual, correta e sumarizada. Face ao volume de dados existente e a necessidade de criar vantagens competitivas para as empresas sobreviverem nos seus mercados importa analisar os dados por forma a identificar informação que poderia estar oculta ou padrões nos comportamentos dos consumidores. É aqui que entra o data mining, cujo principal objetivo é analisar os dados e encontrar anomalias, padrões ou novas informações que auxiliem na tomada de decisão. O setor do retalho é um dos setores que mais valor monetário gera mundialmente e um dos setores onde a concorrência é mais feroz, pelo que quanto mais conhecimento e informações as empresas tiverem ao seu dispor maior será a probabilidade de conseguirem adquirir vantagens competitivas. Nesta procura de informação temos como exemplo as regras de associação, uma técnica de data mining cujo objetivo é encontrar itens que ocorrem frequentemente e em conjunto nos cestos de compras dos clientes. Um dos algoritmos concebidos para a geração de regras de associação é o algoritmo Apriori em que a sua génese foi baseada na análise de compras efetuadas num supermercado. Ao aplicar algoritmos para obter regras de associação ao setor do retalho é comum indicar- se que se usou uma técnica de market basket analysis. Este trabalho tem como principais objetivos a análise exploratória de um dataset público com um grande conjunto de compras (Instacart) e a geração de regras de associação recorrendo à utilização do algoritmo Apriori. Consoante os resultados obtidos serão sugeridas ideias para implementar novas estratégia de marketing. Este trabalho iniciou-se com a revisão da literatura, investigando os conceitos de data mining, regras de associação e market basket analysis. Como bússola orientadora para a aplicação de técnicas de data mining seguiu-se a metodologia CRISP. Para a análise exploratória dos dados foi utilizado o software Power BI e para a transformação dos dados e aplicação do algoritmo Apriori e consequentemente a geração das regras de associação recorreu-se à linguagem Python. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-12 2019-12-01T00:00:00Z 2021-09-23T13:54:21Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.26/37552 urn:tid:202365778 |
| url |
http://hdl.handle.net/10400.26/37552 |
| identifier_str_mv |
urn:tid:202365778 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833602820816764929 |