Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público

Detalhes bibliográficos
Autor(a) principal: Oliveira, Joana Raquel Carias de
Data de Publicação: 2019
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Texto Completo: http://hdl.handle.net/10400.26/37552
Resumo: Hoje em dia, a população encontra-se sobrecarregada com dados, quando todas as atividades realizadas pelas organizações e pessoas, no seu dia-a-dia, geram dados. Contudo, o facto de termos acesso a um enorme volume de dados não significa que tenhamos acesso a muita informação ou conhecimento. É, portanto, importante trabalhar os dados por forma a gerar informação relevante para a tomada de decisão, pois num mundo globalizado e extremamente competitivo, um minuto pode ser fulcral para fechar um negócio e, para tal, é necessário ter acesso à informação atual, correta e sumarizada. Face ao volume de dados existente e a necessidade de criar vantagens competitivas para as empresas sobreviverem nos seus mercados importa analisar os dados por forma a identificar informação que poderia estar oculta ou padrões nos comportamentos dos consumidores. É aqui que entra o data mining, cujo principal objetivo é analisar os dados e encontrar anomalias, padrões ou novas informações que auxiliem na tomada de decisão. O setor do retalho é um dos setores que mais valor monetário gera mundialmente e um dos setores onde a concorrência é mais feroz, pelo que quanto mais conhecimento e informações as empresas tiverem ao seu dispor maior será a probabilidade de conseguirem adquirir vantagens competitivas. Nesta procura de informação temos como exemplo as regras de associação, uma técnica de data mining cujo objetivo é encontrar itens que ocorrem frequentemente e em conjunto nos cestos de compras dos clientes. Um dos algoritmos concebidos para a geração de regras de associação é o algoritmo Apriori em que a sua génese foi baseada na análise de compras efetuadas num supermercado. Ao aplicar algoritmos para obter regras de associação ao setor do retalho é comum indicar- se que se usou uma técnica de market basket analysis. Este trabalho tem como principais objetivos a análise exploratória de um dataset público com um grande conjunto de compras (Instacart) e a geração de regras de associação recorrendo à utilização do algoritmo Apriori. Consoante os resultados obtidos serão sugeridas ideias para implementar novas estratégia de marketing. Este trabalho iniciou-se com a revisão da literatura, investigando os conceitos de data mining, regras de associação e market basket analysis. Como bússola orientadora para a aplicação de técnicas de data mining seguiu-se a metodologia CRISP. Para a análise exploratória dos dados foi utilizado o software Power BI e para a transformação dos dados e aplicação do algoritmo Apriori e consequentemente a geração das regras de associação recorreu-se à linguagem Python.
id RCAP_079a23322ebb1b7da933c813c9bf8c06
oai_identifier_str oai:comum.rcaap.pt:10400.26/37552
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset públicoData MiningRegras de AssociaçãoAlgoritmo AprioriAssociation RulesApriori AlgorithmHoje em dia, a população encontra-se sobrecarregada com dados, quando todas as atividades realizadas pelas organizações e pessoas, no seu dia-a-dia, geram dados. Contudo, o facto de termos acesso a um enorme volume de dados não significa que tenhamos acesso a muita informação ou conhecimento. É, portanto, importante trabalhar os dados por forma a gerar informação relevante para a tomada de decisão, pois num mundo globalizado e extremamente competitivo, um minuto pode ser fulcral para fechar um negócio e, para tal, é necessário ter acesso à informação atual, correta e sumarizada. Face ao volume de dados existente e a necessidade de criar vantagens competitivas para as empresas sobreviverem nos seus mercados importa analisar os dados por forma a identificar informação que poderia estar oculta ou padrões nos comportamentos dos consumidores. É aqui que entra o data mining, cujo principal objetivo é analisar os dados e encontrar anomalias, padrões ou novas informações que auxiliem na tomada de decisão. O setor do retalho é um dos setores que mais valor monetário gera mundialmente e um dos setores onde a concorrência é mais feroz, pelo que quanto mais conhecimento e informações as empresas tiverem ao seu dispor maior será a probabilidade de conseguirem adquirir vantagens competitivas. Nesta procura de informação temos como exemplo as regras de associação, uma técnica de data mining cujo objetivo é encontrar itens que ocorrem frequentemente e em conjunto nos cestos de compras dos clientes. Um dos algoritmos concebidos para a geração de regras de associação é o algoritmo Apriori em que a sua génese foi baseada na análise de compras efetuadas num supermercado. Ao aplicar algoritmos para obter regras de associação ao setor do retalho é comum indicar- se que se usou uma técnica de market basket analysis. Este trabalho tem como principais objetivos a análise exploratória de um dataset público com um grande conjunto de compras (Instacart) e a geração de regras de associação recorrendo à utilização do algoritmo Apriori. Consoante os resultados obtidos serão sugeridas ideias para implementar novas estratégia de marketing. Este trabalho iniciou-se com a revisão da literatura, investigando os conceitos de data mining, regras de associação e market basket analysis. Como bússola orientadora para a aplicação de técnicas de data mining seguiu-se a metodologia CRISP. Para a análise exploratória dos dados foi utilizado o software Power BI e para a transformação dos dados e aplicação do algoritmo Apriori e consequentemente a geração das regras de associação recorreu-se à linguagem Python.Barbosa, VictorRepositório ComumOliveira, Joana Raquel Carias de2021-09-23T13:54:21Z2019-122019-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.26/37552urn:tid:202365778porinfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-05-02T16:32:12Zoai:comum.rcaap.pt:10400.26/37552Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T06:54:00.044824Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
title Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
spellingShingle Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
Oliveira, Joana Raquel Carias de
Data Mining
Regras de Associação
Algoritmo Apriori
Association Rules
Apriori Algorithm
title_short Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
title_full Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
title_fullStr Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
title_full_unstemmed Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
title_sort Data Mining na procura de nova informação: Market Basket Analysis aplicado a um dataset público
author Oliveira, Joana Raquel Carias de
author_facet Oliveira, Joana Raquel Carias de
author_role author
dc.contributor.none.fl_str_mv Barbosa, Victor
Repositório Comum
dc.contributor.author.fl_str_mv Oliveira, Joana Raquel Carias de
dc.subject.por.fl_str_mv Data Mining
Regras de Associação
Algoritmo Apriori
Association Rules
Apriori Algorithm
topic Data Mining
Regras de Associação
Algoritmo Apriori
Association Rules
Apriori Algorithm
description Hoje em dia, a população encontra-se sobrecarregada com dados, quando todas as atividades realizadas pelas organizações e pessoas, no seu dia-a-dia, geram dados. Contudo, o facto de termos acesso a um enorme volume de dados não significa que tenhamos acesso a muita informação ou conhecimento. É, portanto, importante trabalhar os dados por forma a gerar informação relevante para a tomada de decisão, pois num mundo globalizado e extremamente competitivo, um minuto pode ser fulcral para fechar um negócio e, para tal, é necessário ter acesso à informação atual, correta e sumarizada. Face ao volume de dados existente e a necessidade de criar vantagens competitivas para as empresas sobreviverem nos seus mercados importa analisar os dados por forma a identificar informação que poderia estar oculta ou padrões nos comportamentos dos consumidores. É aqui que entra o data mining, cujo principal objetivo é analisar os dados e encontrar anomalias, padrões ou novas informações que auxiliem na tomada de decisão. O setor do retalho é um dos setores que mais valor monetário gera mundialmente e um dos setores onde a concorrência é mais feroz, pelo que quanto mais conhecimento e informações as empresas tiverem ao seu dispor maior será a probabilidade de conseguirem adquirir vantagens competitivas. Nesta procura de informação temos como exemplo as regras de associação, uma técnica de data mining cujo objetivo é encontrar itens que ocorrem frequentemente e em conjunto nos cestos de compras dos clientes. Um dos algoritmos concebidos para a geração de regras de associação é o algoritmo Apriori em que a sua génese foi baseada na análise de compras efetuadas num supermercado. Ao aplicar algoritmos para obter regras de associação ao setor do retalho é comum indicar- se que se usou uma técnica de market basket analysis. Este trabalho tem como principais objetivos a análise exploratória de um dataset público com um grande conjunto de compras (Instacart) e a geração de regras de associação recorrendo à utilização do algoritmo Apriori. Consoante os resultados obtidos serão sugeridas ideias para implementar novas estratégia de marketing. Este trabalho iniciou-se com a revisão da literatura, investigando os conceitos de data mining, regras de associação e market basket analysis. Como bússola orientadora para a aplicação de técnicas de data mining seguiu-se a metodologia CRISP. Para a análise exploratória dos dados foi utilizado o software Power BI e para a transformação dos dados e aplicação do algoritmo Apriori e consequentemente a geração das regras de associação recorreu-se à linguagem Python.
publishDate 2019
dc.date.none.fl_str_mv 2019-12
2019-12-01T00:00:00Z
2021-09-23T13:54:21Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.26/37552
urn:tid:202365778
url http://hdl.handle.net/10400.26/37552
identifier_str_mv urn:tid:202365778
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833602820816764929