Automated web scraping and data visualisation for tourism based on popular accommodation platforms
| Main Author: | |
|---|---|
| Publication Date: | 2022 |
| Format: | Master thesis |
| Language: | eng |
| Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Download full: | https://hdl.handle.net/1822/81399 |
Summary: | Dissertação de mestrado em Humanidades Digitais |
| id |
RCAP_a91245de6d98e3d4fc91278ef145be23 |
|---|---|
| oai_identifier_str |
oai:repositorium.sdum.uminho.pt:1822/81399 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Automated web scraping and data visualisation for tourism based on popular accommodation platformsWeb scraping e visualização de dados de turismo automatizados, com base em plataformas populares de alojamentoWeb scrapingTourismPythonData visualisationData scienceTurismoVisualização de dadosCiência de dadosHumanidades::Outras HumanidadesDissertação de mestrado em Humanidades DigitaisThe project developed is part of “Programa INTERREG V A España – Portugal (POCTEP)”, on which several entities collaborate in cross-border projects, with the main goal of securing the sustainability, innovation and efficient management of tourism resources in Portugal and Spain, while also harmonising the use of technology in the tourism sector. Through web scraping and data visualisation techniques, information regarding tourists and their destinations was extracted from online platforms, being then organised and interpreted, in order to obtain useful insights. With the Python programming language as this project’s main pillar, an automated web scraping tool was designed, with a custom user interface to facilitate access. Then, after the cleaning of data using regular expressions and text replacement, several graphs were conceived, followed by a data visualisation dashboard which also allows interaction with those graphs. In the end, the whole process was automated, allowing this method to periodically monitor the targeted tourism areas with efficiency. Thus, through this self-sufficient competitive vigilance system, an effective management of the tourism sector resources can be ensured.O projeto desenvolvido faz parte do “Programa INTERREG V A España – Portugal (POCTEP)”, no qual diversas entidades colaboram em projetos transfronteiriços, com o principal objetivo de assegurar a sustentabilidade, inovação e gestão eficiente dos recursos turísticos em Portugal e Espanha, harmonizando também o uso da tecnologia no setor turístico. Através de técnicas de web scraping e de visualização dados, foi extraída de plataformas turísticas informação relativa aos turistas e aos seus destinos turísticos, sendo então organizada e interpretada, de forma a obter as suas perceções. Com a linguagem de programação Python como o principal pilar deste projeto, uma ferramenta de web scraping automatizada foi criada, com uma interface de utilizador customizada, para facilitar o acesso. Então, após a limpeza dos dados usando expressões regulares e substituição de texto, vários gráficos foram concebidos, seguidos de uma dashboard de visualização de dados que também permite interação com esses dados. No fim, o processo todo foi automatizado, permitindo que este método analise periodicamente as áreas-alvo de turismo com eficácia. Assim, através deste sistema de vigilância competitiva autossuficiente, uma gestão eficiente dos recursos do sector turístico pode ser assegurada.Lopes, Sérgio F.Araújo, SílviaUniversidade do MinhoPereira, Sérgio Rosa2022-10-262022-10-26T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttps://hdl.handle.net/1822/81399eng203085000info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-11T05:16:07Zoai:repositorium.sdum.uminho.pt:1822/81399Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T15:12:59.029828Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms Web scraping e visualização de dados de turismo automatizados, com base em plataformas populares de alojamento |
| title |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms |
| spellingShingle |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms Pereira, Sérgio Rosa Web scraping Tourism Python Data visualisation Data science Turismo Visualização de dados Ciência de dados Humanidades::Outras Humanidades |
| title_short |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms |
| title_full |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms |
| title_fullStr |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms |
| title_full_unstemmed |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms |
| title_sort |
Automated web scraping and data visualisation for tourism based on popular accommodation platforms |
| author |
Pereira, Sérgio Rosa |
| author_facet |
Pereira, Sérgio Rosa |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Lopes, Sérgio F. Araújo, Sílvia Universidade do Minho |
| dc.contributor.author.fl_str_mv |
Pereira, Sérgio Rosa |
| dc.subject.por.fl_str_mv |
Web scraping Tourism Python Data visualisation Data science Turismo Visualização de dados Ciência de dados Humanidades::Outras Humanidades |
| topic |
Web scraping Tourism Python Data visualisation Data science Turismo Visualização de dados Ciência de dados Humanidades::Outras Humanidades |
| description |
Dissertação de mestrado em Humanidades Digitais |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-10-26 2022-10-26T00:00:00Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/1822/81399 |
| url |
https://hdl.handle.net/1822/81399 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
203085000 |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833595173019320320 |