Automated web scraping and data visualisation for tourism based on popular accommodation platforms

Detalhes bibliográficos
Autor(a) principal: Pereira, Sérgio Rosa
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: eng
Título da fonte: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Texto Completo: https://hdl.handle.net/1822/81399
Resumo: Dissertação de mestrado em Humanidades Digitais
id RCAP_a91245de6d98e3d4fc91278ef145be23
oai_identifier_str oai:repositorium.sdum.uminho.pt:1822/81399
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Automated web scraping and data visualisation for tourism based on popular accommodation platformsWeb scraping e visualização de dados de turismo automatizados, com base em plataformas populares de alojamentoWeb scrapingTourismPythonData visualisationData scienceTurismoVisualização de dadosCiência de dadosHumanidades::Outras HumanidadesDissertação de mestrado em Humanidades DigitaisThe project developed is part of “Programa INTERREG V A España – Portugal (POCTEP)”, on which several entities collaborate in cross-border projects, with the main goal of securing the sustainability, innovation and efficient management of tourism resources in Portugal and Spain, while also harmonising the use of technology in the tourism sector. Through web scraping and data visualisation techniques, information regarding tourists and their destinations was extracted from online platforms, being then organised and interpreted, in order to obtain useful insights. With the Python programming language as this project’s main pillar, an automated web scraping tool was designed, with a custom user interface to facilitate access. Then, after the cleaning of data using regular expressions and text replacement, several graphs were conceived, followed by a data visualisation dashboard which also allows interaction with those graphs. In the end, the whole process was automated, allowing this method to periodically monitor the targeted tourism areas with efficiency. Thus, through this self-sufficient competitive vigilance system, an effective management of the tourism sector resources can be ensured.O projeto desenvolvido faz parte do “Programa INTERREG V A España – Portugal (POCTEP)”, no qual diversas entidades colaboram em projetos transfronteiriços, com o principal objetivo de assegurar a sustentabilidade, inovação e gestão eficiente dos recursos turísticos em Portugal e Espanha, harmonizando também o uso da tecnologia no setor turístico. Através de técnicas de web scraping e de visualização dados, foi extraída de plataformas turísticas informação relativa aos turistas e aos seus destinos turísticos, sendo então organizada e interpretada, de forma a obter as suas perceções. Com a linguagem de programação Python como o principal pilar deste projeto, uma ferramenta de web scraping automatizada foi criada, com uma interface de utilizador customizada, para facilitar o acesso. Então, após a limpeza dos dados usando expressões regulares e substituição de texto, vários gráficos foram concebidos, seguidos de uma dashboard de visualização de dados que também permite interação com esses dados. No fim, o processo todo foi automatizado, permitindo que este método analise periodicamente as áreas-alvo de turismo com eficácia. Assim, através deste sistema de vigilância competitiva autossuficiente, uma gestão eficiente dos recursos do sector turístico pode ser assegurada.Lopes, Sérgio F.Araújo, SílviaUniversidade do MinhoPereira, Sérgio Rosa2022-10-262022-10-26T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81399eng203085000info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T05:16:07Zoai:repositorium.sdum.uminho.pt:1822/81399Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T15:12:59.029828Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Automated web scraping and data visualisation for tourism based on popular accommodation platforms
Web scraping e visualização de dados de turismo automatizados, com base em plataformas populares de alojamento
title Automated web scraping and data visualisation for tourism based on popular accommodation platforms
spellingShingle Automated web scraping and data visualisation for tourism based on popular accommodation platforms
Pereira, Sérgio Rosa
Web scraping
Tourism
Python
Data visualisation
Data science
Turismo
Visualização de dados
Ciência de dados
Humanidades::Outras Humanidades
title_short Automated web scraping and data visualisation for tourism based on popular accommodation platforms
title_full Automated web scraping and data visualisation for tourism based on popular accommodation platforms
title_fullStr Automated web scraping and data visualisation for tourism based on popular accommodation platforms
title_full_unstemmed Automated web scraping and data visualisation for tourism based on popular accommodation platforms
title_sort Automated web scraping and data visualisation for tourism based on popular accommodation platforms
author Pereira, Sérgio Rosa
author_facet Pereira, Sérgio Rosa
author_role author
dc.contributor.none.fl_str_mv Lopes, Sérgio F.
Araújo, Sílvia
Universidade do Minho
dc.contributor.author.fl_str_mv Pereira, Sérgio Rosa
dc.subject.por.fl_str_mv Web scraping
Tourism
Python
Data visualisation
Data science
Turismo
Visualização de dados
Ciência de dados
Humanidades::Outras Humanidades
topic Web scraping
Tourism
Python
Data visualisation
Data science
Turismo
Visualização de dados
Ciência de dados
Humanidades::Outras Humanidades
description Dissertação de mestrado em Humanidades Digitais
publishDate 2022
dc.date.none.fl_str_mv 2022-10-26
2022-10-26T00:00:00Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://hdl.handle.net/1822/81399
url https://hdl.handle.net/1822/81399
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv 203085000
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833595173019320320