Estimating house market prices: a data-driven approach on a portuguese data set

Bibliographic Details
Main Author: Palma, Myke Dylan van Ingen
Publication Date: 2023
Format: Master thesis
Language: eng
Source: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Download full: http://hdl.handle.net/10400.5/30949
Summary: Mestrado Bolonha em Gestão de Sistemas de Informação
id RCAP_43dbc60295fd078e7127f6dc8c3f3412
oai_identifier_str oai:repositorio.ulisboa.pt:10400.5/30949
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Estimating house market prices: a data-driven approach on a portuguese data setMercado imobiliário portuguêsMachine learningRedes NeuronaisPortuguese housing marketNeural NetworkMestrado Bolonha em Gestão de Sistemas de InformaçãoAquando deste estudo, o mercado imobiliário estava a passar por um aumento de valor sem precedentes, marcado por um consistente crescimento exponencial, com apenas algumas exceções notáveis. Prever o valor de uma propriedade poderia servir como um passo inicial para entender este mercado, beneficiando substancialmente indivíduos interessados em comprar ou vender casa. Este estudo teve como objetivo estimar valores do mercado imobiliário através da aplicação de técnicas de Data Science, utilizando fontes de dados internas e externas associadas a imóveis. De forma a atingir o objetivo acima mencionado, foi realizado um processo meticuloso de seleção e recolha de dados. Para isso uma fonte de dados de imobiliários recente e rica foi utilizada, embora deva ser salientado que, a mesma tinha a algumas limitações. Para garantir uma abordagem consistente e estruturada no desenvolvimento do projeto, foi aplicado o modelo Cross-industry standard process for data mining (CRISP-DM). Tentou-se aprofundar a compreensão do domínio do mercado imobiliário, extraindo informações da literatura existente e do conjunto de dados adquirido. Subsequentemente, os dados foram explorados com recurso a Power BI, possibilitando assim, uma análise minuciosa deste conjunto de dados. Utilizando Python, todos os dados foram agregados e pré-processados de forma a facilitar o desenvolvimento e teste de vários modelos preditivos. Por fim, o modelo que demonstrou maior precisão foi selecionado e integrado numa aplicação web Flask, permitindo interações de utilizadores com o modelo preditivo desenvolvido. Este estudo, que foi focado no mercado imobiliário português, revela que fatores internos e externos exercem uma influência significativa no valor dos imóveis. Verificou-se que variáveis internas como o número de quartos, casas de banho, o tipo de imóvel, dimensão e localização, em conjunto com variáveis externas, como a taxa Euribor e a inflação, têm correlações diretas com os preços das casas. Resultados de testes rigorosos ao modelo corroboraram a literatura existente: o algoritmo Multi-layer Perceptron revelou ser o modelo mais eficaz para estimar o valor de imóveis, apresentando uma taxa de erro notavelmente baixa, variando apenas de 2,3% a um máximo de 16,3% no pior cenário testado. Além disso, observou-se que variáveis de input neste modelo em particular exibiam interdependência, portanto mudanças numa variável influenciavam diretamente o impacto de outras variáveis no resultado do modelo.At the time of this research, the real estate market was experiencing an unprecedented surge in value, marked by consistent exponential growth with only a few notable exceptions. Predicting the value of a property could potentially serve as an initial step toward understanding this market, offering substantial advantages to prospective home buyers and sellers alike. This study aimed to estimate property market values through the application of data science techniques, utilizing both internal and external data sources associated with real estate properties. In order to achieve the aforementioned objective, a meticulous process of data selection and collection was undertaken. A comprehensive and up-to-date real estate data source was leveraged, although it should be noted that it had certain data limitations. To ensure a consistent and structured approach to project progression, the Cross-industry standard process for data mining (CRISP-DM) model was applied. Drawing insights from existing literature and the acquired data set, efforts were made to enhance the understanding of the real estate domain. Subsequently, data exploration was conducted by adopting Power BI, enabling a thorough examination of the data set. All data underwent aggregation and preprocessing using Python to facilitate the development and testing of various predictive models. Ultimately, the model demonstrating the highest accuracy was selected and integrated into a Flask web application, enabling user interactions with the developed predictive model. This study, centered on the real estate market in Portugal, highlights both internal and external factors exert a significant influence on property values. Internal variables, such as the number of rooms, bathrooms, property type, size, and location, alongside external variables, including the Euribor rate and inflation, were found to have direct correlations with house prices. Through rigorous model testing, the findings reinforced existing research: the Multilayer Perceptron algorithm emerged as the most effective model for estimating property values, demonstrating a remarkably low error rate, ranging from as little as 2,3% to a maximum of 16,3% in the worst-case scenario tested. Furthermore, it was observed that the input variables within this particular model exhibited interdependence, signifying that changes in one variable directly influenced the impact of other variables in the predictive model result.Pereira, RuiInstituto Superior de Economia e GestãoRepositório da Universidade de LisboaPalma, Myke Dylan van Ingen2024-05-08T12:18:10Z2023-122023-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/30949engPalma, Myke Dylan van Ingen (2023). "Estimating house market prices: a data-driven approach on a portuguese data set". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-03-17T15:33:24Zoai:repositorio.ulisboa.pt:10400.5/30949Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T03:46:56.905363Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Estimating house market prices: a data-driven approach on a portuguese data set
title Estimating house market prices: a data-driven approach on a portuguese data set
spellingShingle Estimating house market prices: a data-driven approach on a portuguese data set
Palma, Myke Dylan van Ingen
Mercado imobiliário português
Machine learning
Redes Neuronais
Portuguese housing market
Neural Network
title_short Estimating house market prices: a data-driven approach on a portuguese data set
title_full Estimating house market prices: a data-driven approach on a portuguese data set
title_fullStr Estimating house market prices: a data-driven approach on a portuguese data set
title_full_unstemmed Estimating house market prices: a data-driven approach on a portuguese data set
title_sort Estimating house market prices: a data-driven approach on a portuguese data set
author Palma, Myke Dylan van Ingen
author_facet Palma, Myke Dylan van Ingen
author_role author
dc.contributor.none.fl_str_mv Pereira, Rui
Instituto Superior de Economia e Gestão
Repositório da Universidade de Lisboa
dc.contributor.author.fl_str_mv Palma, Myke Dylan van Ingen
dc.subject.por.fl_str_mv Mercado imobiliário português
Machine learning
Redes Neuronais
Portuguese housing market
Neural Network
topic Mercado imobiliário português
Machine learning
Redes Neuronais
Portuguese housing market
Neural Network
description Mestrado Bolonha em Gestão de Sistemas de Informação
publishDate 2023
dc.date.none.fl_str_mv 2023-12
2023-12-01T00:00:00Z
2024-05-08T12:18:10Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10400.5/30949
url http://hdl.handle.net/10400.5/30949
dc.language.iso.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv Palma, Myke Dylan van Ingen (2023). "Estimating house market prices: a data-driven approach on a portuguese data set". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão.
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833601831772618752