Estimating house market prices: a data-driven approach on a portuguese data set
| Main Author: | |
|---|---|
| Publication Date: | 2023 |
| Format: | Master thesis |
| Language: | eng |
| Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Download full: | http://hdl.handle.net/10400.5/30949 |
Summary: | Mestrado Bolonha em Gestão de Sistemas de Informação |
| id |
RCAP_43dbc60295fd078e7127f6dc8c3f3412 |
|---|---|
| oai_identifier_str |
oai:repositorio.ulisboa.pt:10400.5/30949 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Estimating house market prices: a data-driven approach on a portuguese data setMercado imobiliário portuguêsMachine learningRedes NeuronaisPortuguese housing marketNeural NetworkMestrado Bolonha em Gestão de Sistemas de InformaçãoAquando deste estudo, o mercado imobiliário estava a passar por um aumento de valor sem precedentes, marcado por um consistente crescimento exponencial, com apenas algumas exceções notáveis. Prever o valor de uma propriedade poderia servir como um passo inicial para entender este mercado, beneficiando substancialmente indivíduos interessados em comprar ou vender casa. Este estudo teve como objetivo estimar valores do mercado imobiliário através da aplicação de técnicas de Data Science, utilizando fontes de dados internas e externas associadas a imóveis. De forma a atingir o objetivo acima mencionado, foi realizado um processo meticuloso de seleção e recolha de dados. Para isso uma fonte de dados de imobiliários recente e rica foi utilizada, embora deva ser salientado que, a mesma tinha a algumas limitações. Para garantir uma abordagem consistente e estruturada no desenvolvimento do projeto, foi aplicado o modelo Cross-industry standard process for data mining (CRISP-DM). Tentou-se aprofundar a compreensão do domínio do mercado imobiliário, extraindo informações da literatura existente e do conjunto de dados adquirido. Subsequentemente, os dados foram explorados com recurso a Power BI, possibilitando assim, uma análise minuciosa deste conjunto de dados. Utilizando Python, todos os dados foram agregados e pré-processados de forma a facilitar o desenvolvimento e teste de vários modelos preditivos. Por fim, o modelo que demonstrou maior precisão foi selecionado e integrado numa aplicação web Flask, permitindo interações de utilizadores com o modelo preditivo desenvolvido. Este estudo, que foi focado no mercado imobiliário português, revela que fatores internos e externos exercem uma influência significativa no valor dos imóveis. Verificou-se que variáveis internas como o número de quartos, casas de banho, o tipo de imóvel, dimensão e localização, em conjunto com variáveis externas, como a taxa Euribor e a inflação, têm correlações diretas com os preços das casas. Resultados de testes rigorosos ao modelo corroboraram a literatura existente: o algoritmo Multi-layer Perceptron revelou ser o modelo mais eficaz para estimar o valor de imóveis, apresentando uma taxa de erro notavelmente baixa, variando apenas de 2,3% a um máximo de 16,3% no pior cenário testado. Além disso, observou-se que variáveis de input neste modelo em particular exibiam interdependência, portanto mudanças numa variável influenciavam diretamente o impacto de outras variáveis no resultado do modelo.At the time of this research, the real estate market was experiencing an unprecedented surge in value, marked by consistent exponential growth with only a few notable exceptions. Predicting the value of a property could potentially serve as an initial step toward understanding this market, offering substantial advantages to prospective home buyers and sellers alike. This study aimed to estimate property market values through the application of data science techniques, utilizing both internal and external data sources associated with real estate properties. In order to achieve the aforementioned objective, a meticulous process of data selection and collection was undertaken. A comprehensive and up-to-date real estate data source was leveraged, although it should be noted that it had certain data limitations. To ensure a consistent and structured approach to project progression, the Cross-industry standard process for data mining (CRISP-DM) model was applied. Drawing insights from existing literature and the acquired data set, efforts were made to enhance the understanding of the real estate domain. Subsequently, data exploration was conducted by adopting Power BI, enabling a thorough examination of the data set. All data underwent aggregation and preprocessing using Python to facilitate the development and testing of various predictive models. Ultimately, the model demonstrating the highest accuracy was selected and integrated into a Flask web application, enabling user interactions with the developed predictive model. This study, centered on the real estate market in Portugal, highlights both internal and external factors exert a significant influence on property values. Internal variables, such as the number of rooms, bathrooms, property type, size, and location, alongside external variables, including the Euribor rate and inflation, were found to have direct correlations with house prices. Through rigorous model testing, the findings reinforced existing research: the Multilayer Perceptron algorithm emerged as the most effective model for estimating property values, demonstrating a remarkably low error rate, ranging from as little as 2,3% to a maximum of 16,3% in the worst-case scenario tested. Furthermore, it was observed that the input variables within this particular model exhibited interdependence, signifying that changes in one variable directly influenced the impact of other variables in the predictive model result.Pereira, RuiInstituto Superior de Economia e GestãoRepositório da Universidade de LisboaPalma, Myke Dylan van Ingen2024-05-08T12:18:10Z2023-122023-12-01T00:00:00Zinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10400.5/30949engPalma, Myke Dylan van Ingen (2023). "Estimating house market prices: a data-driven approach on a portuguese data set". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão.info:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2025-03-17T15:33:24Zoai:repositorio.ulisboa.pt:10400.5/30949Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T03:46:56.905363Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Estimating house market prices: a data-driven approach on a portuguese data set |
| title |
Estimating house market prices: a data-driven approach on a portuguese data set |
| spellingShingle |
Estimating house market prices: a data-driven approach on a portuguese data set Palma, Myke Dylan van Ingen Mercado imobiliário português Machine learning Redes Neuronais Portuguese housing market Neural Network |
| title_short |
Estimating house market prices: a data-driven approach on a portuguese data set |
| title_full |
Estimating house market prices: a data-driven approach on a portuguese data set |
| title_fullStr |
Estimating house market prices: a data-driven approach on a portuguese data set |
| title_full_unstemmed |
Estimating house market prices: a data-driven approach on a portuguese data set |
| title_sort |
Estimating house market prices: a data-driven approach on a portuguese data set |
| author |
Palma, Myke Dylan van Ingen |
| author_facet |
Palma, Myke Dylan van Ingen |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Pereira, Rui Instituto Superior de Economia e Gestão Repositório da Universidade de Lisboa |
| dc.contributor.author.fl_str_mv |
Palma, Myke Dylan van Ingen |
| dc.subject.por.fl_str_mv |
Mercado imobiliário português Machine learning Redes Neuronais Portuguese housing market Neural Network |
| topic |
Mercado imobiliário português Machine learning Redes Neuronais Portuguese housing market Neural Network |
| description |
Mestrado Bolonha em Gestão de Sistemas de Informação |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-12 2023-12-01T00:00:00Z 2024-05-08T12:18:10Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10400.5/30949 |
| url |
http://hdl.handle.net/10400.5/30949 |
| dc.language.iso.fl_str_mv |
eng |
| language |
eng |
| dc.relation.none.fl_str_mv |
Palma, Myke Dylan van Ingen (2023). "Estimating house market prices: a data-driven approach on a portuguese data set". Dissertação de Mestrado. Universidade de Lisboa. Instituto Superior de Economia e Gestão. |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833601831772618752 |