Exploração de dados em falta: Uma abordagem visual
Main Author: | |
---|---|
Publication Date: | 2018 |
Format: | Master thesis |
Language: | por |
Source: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
Download full: | https://hdl.handle.net/10316/86107 |
Summary: | Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia |
id |
RCAP_af9f2bc56d4faefa69cb9c149051a02a |
---|---|
oai_identifier_str |
oai:estudogeral.uc.pt:10316/86107 |
network_acronym_str |
RCAP |
network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository_id_str |
https://opendoar.ac.uk/repository/7160 |
spelling |
Exploração de dados em falta: Uma abordagem visualMissing Data Exploration: A visual approachdados em faltaimputação de dadosvisualização de dadosgráficos interativosexploração de dadosMissing datamissing valuesdata visualizationinteractive graphicsexploratory analysisTrabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e TecnologiaOs dados em falta são um problema comum na análise de dados e podem ocorrer devido a múltiplos fatores, tais como falha de sensores, resultados de análises perdidos ou amostras contaminadas. Ao longo dos anos, foram utilizadas diversas estratégias para resolver este problema, sendo as mais comuns a eliminação dos casos com valores em falta e sua substituição por valores estimados de acordo com os restantes dados - imputação. Todavia, para se escolher a técnica mais adequada para lidar com os dados em falta é fundamental compreender as suas caraterísticas intrínsecas, tais como a sua distribuição e o tipo de mecanismo em causa. Estudos recentes indicam que a exploração de dados em falta pode ser realizada através de métodos de visualização,afirmando que esta técnica permite uma análise aprofundada, orientando assim a escolha apropriada de um método de imputação.O objetivo principal desta tese prende-se com o desenvolvimento de uma ferramenta intuitiva e transparente que permita a exploração dos dados em falta através de métodos de visualização, auxiliando o utilizador na escolha do método de imputação mais apropriado. A ferramenta foi desenhada tendo em mente dois perfis distintos de utilizador (iniciantes e especialistas da área) e a capacidade para lidar com conjuntos de dados de grande dimensionalidade. As diversas funcionalidades da ferramenta foram validades através da realização de um caso de estudo.Missing data is a common problem in data analysis and can occur due to many factors, such as sensor failure, lost analysis results or contaminated samples. Through the years, different strategies have been used to solve this problem, the most common being the elimination of cases with missing values and their substitution according to the remaining data - imputation. However, to choose the most adequate technique to handle missing data it is fundamental to understand its intrinsic characteristics, such as data distribution and missing mechanism. Recent studies indicate that the missing data exploration can be performed through visualization methods, positively reinforcing that this technique allows a profound analysis, supporting the choice of an appropriate imputation method. The main focus of this thesis is to develop an intuitive and transparent tool that allows missing data exploration through visualization methods and helps the user to choose the most appropriate imputation method. The tool was designed bearing in mind two distinct user profiles (beginners and experts) and ability to handle high-dimensional data. The several features included in tool were validated through a case study.2018-09-19info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesishttps://hdl.handle.net/10316/86107https://hdl.handle.net/10316/86107TID:202206300porCosta, Cláudia Filipa Gaspar dainfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2019-06-02T13:12:15Zoai:estudogeral.uc.pt:10316/86107Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-29T05:33:28.381901Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
dc.title.none.fl_str_mv |
Exploração de dados em falta: Uma abordagem visual Missing Data Exploration: A visual approach |
title |
Exploração de dados em falta: Uma abordagem visual |
spellingShingle |
Exploração de dados em falta: Uma abordagem visual Costa, Cláudia Filipa Gaspar da dados em falta imputação de dados visualização de dados gráficos interativos exploração de dados Missing data missing values data visualization interactive graphics exploratory analysis |
title_short |
Exploração de dados em falta: Uma abordagem visual |
title_full |
Exploração de dados em falta: Uma abordagem visual |
title_fullStr |
Exploração de dados em falta: Uma abordagem visual |
title_full_unstemmed |
Exploração de dados em falta: Uma abordagem visual |
title_sort |
Exploração de dados em falta: Uma abordagem visual |
author |
Costa, Cláudia Filipa Gaspar da |
author_facet |
Costa, Cláudia Filipa Gaspar da |
author_role |
author |
dc.contributor.author.fl_str_mv |
Costa, Cláudia Filipa Gaspar da |
dc.subject.por.fl_str_mv |
dados em falta imputação de dados visualização de dados gráficos interativos exploração de dados Missing data missing values data visualization interactive graphics exploratory analysis |
topic |
dados em falta imputação de dados visualização de dados gráficos interativos exploração de dados Missing data missing values data visualization interactive graphics exploratory analysis |
description |
Trabalho de Projeto do Mestrado Integrado em Engenharia Biomédica apresentado à Faculdade de Ciências e Tecnologia |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-09-19 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
format |
masterThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://hdl.handle.net/10316/86107 https://hdl.handle.net/10316/86107 TID:202206300 |
url |
https://hdl.handle.net/10316/86107 |
identifier_str_mv |
TID:202206300 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
instacron_str |
RCAAP |
institution |
RCAAP |
reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
repository.mail.fl_str_mv |
info@rcaap.pt |
_version_ |
1833602394370342912 |