Framework para publicação de dados com ênfase em enriquecimento e mapeamento semântico

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Luz, Larissa Pavarini da [UNESP]
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual Paulista (Unesp)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11449/204711
Resumo: Em um ambiente de dados como a Web a publicação de dados ainda é vista como um contexto de processo de descrição sem padronização, uma vez que, para cada domínio, criam-se diferentes formatos e modelos de dados. Para melhorar a interoperabilidade semântica sobre esses datasets ou repositórios heterogêneos, a Web Semântica tem sido adotada, permitindo, assim, a troca reuso ou a coleta de recursos digitais. O objetivo desse trabalho é propor um Framework com a finalidade de guiar, por meio de diretrizes e recomendações, o processo que gera todo o contexto necessário ao processo de extração, limpeza, enriquecimento e mapeamento de dados, descrevendo seus passos de forma organizada e sequencial, com o objetivo de seguir as melhores práticas de publicação de dados na Web. A metodologia define-se como pesquisa descritiva e técnica de análise dos dados e de conteúdo, em que foram aplicados métodos como revisão bibliográfica - definido para o desenvolvimento da investigação -, bem como os resultados de uma revisão sistemática da literatura, que evidencia a singularidade da proposta. Este trabalho determinou cinco diretrizes que geram o estado em questão, analisando alguns projetos correlatos e todo o contexto envolvido para que se chegue ao processo de enriquecimento e mapeamento, dando ênfase aos processos necessários que intervêm durante a proposta da tese, com o objetivo de estabeler diretrizes generalizadas. Para testar o Framework proposto foi realizada uma prova de conceito com as diretrizes identificadas em conjunto de dados do Metrô de São Paulo enriquecidos com outros conjuntos de dados disponíveis. Esta prova de conceito proporcionou o desenvolvimento de uma aplicação, com o propósito de conhecer todo o processo relacionado com enriquecimento e mapeamento de dados vinculados às boas práticas para publicação.