Detalhes bibliográficos
Ano de defesa: |
2018 |
Autor(a) principal: |
SANTOS, Helton Douglas Araújo dos |
Orientador(a): |
LÓSCIO, Bernadette Farias |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Federal de Pernambuco
|
Programa de Pós-Graduação: |
Programa de Pos Graduacao em Ciencia da Computacao
|
Departamento: |
Não Informado pela instituição
|
País: |
Brasil
|
Palavras-chave em Português: |
|
Link de acesso: |
https://repositorio.ufpe.br/handle/123456789/33306
|
Resumo: |
Desde o seu surgimento, a Web tem emergido como um importante canal de compartilhamento e troca de informações, habilitando a publicação e o consumo de conjuntos de dados de diferentes domínios. Na Web há uma participação ativa de atores que podem ser desde indivíduos até organizações públicas ou privadas, ou até mesmo sistemas ou dispositivos móveis. Esses atores podem agir tanto como publicadores quanto como consumidores de dados. O publicador produz, entrega e refina dados de algum tipo de acordo com condições específicas, enquanto que o consumidor, acessa e consome os dados, realizando análises, construindo visualizações, como também gerando novos dados. De maneira geral, dados na Web seguem um ciclo de vida composto de várias fases que vão desde a preparação dos dados até o refinamento. Em particular, o refinamento de conjuntos de dados diz respeito às atividades de limpeza e enriquecimento de dados, como também a atualizações e adição de novos dados a conjuntos de dados já existentes. Usualmente, o refinamento é realizado pelos publicadores de dados antes de efetuarem a publicação dos dados. Porém, consumidores de dados também realizam frequentemente a limpeza e o enriquecimento de conjuntos de dados ao processarem os mesmos nas suas atividades de consumo. É importante notar que o resultado do refinamento realizado pelos consumidores, na maioria das vezes, não é compartilhado nem com os publicadores do conjunto de dados original nem com outros consumidores interessados no mesmo conjunto de dados. Dessa forma, é muito comum que exista retrabalho, tanto por parte dos publicadores como por parte dos consumidores, uma vez que o resultado das atividades de refinamento não são compartilhadas. Nesse contexto, o objetivo deste trabalho é propor uma estratégia baseada nos princípios de open collaboration e social coding que permita o refinamento, de forma colaborativa, de conjuntos de dados publicados na Web, contribuindo, assim, para reduzir o retrabalho nas atividades de refinamento, bem como para melhorar a qualidade dos conjuntos de dados na Web. |