LigADOS: interligação de conjuntos de dados em plataformas de dados abertos na web semântica

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Figueiredo, Glaucia Botelho de
Orientador(a): Campos, Maria Luiza Machado, Cordeiro, Kelli de Faria
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Rio de Janeiro (UFRJ)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.repositorio.mar.mil.br/handle/ripcmb/845426
Resumo: O movimento de abertura de dados tem sido pautado na necessidade de atendimento de leis de acesso à informação para reforçar responsabilidade e transparência, que estabelecem a necessidade de disponibilizar dados sobre atividades públicas e privadas aos cidadãos e à sociedade em geral, bem como resultados de pesquisas científicas. A disponibilização de dados ao público pode variar desde um simples site na Internet até aplicativos sofisticados de acesso aos dados. Neste contexto, uma das opções é a construção de um portal de dados abertos utilizando softwares de plataformas de dados abertos, como o CKAN. Nos últimos anos, tem havido uma rápida proliferação desses portais. Nas plataformas de dados abertos, os conjuntos de dados normalmente são descritos por metadados com pouca semântica. Em função disso, os conjuntos de dados muitas vezes permanecem como “silos de dados”, sem conexão explícita ou mecanismo de integração de dados, tornando difícil para os usuários localizar e inter-relacionar fontes de dados relevantes. Em contraste, a Web Semântica apoia-se em uma forma de modelar e representar dados com o intuito de estabelecer inter-relacionamentos entre os dados, acompanhados de descritores mais ricos. Com base neste cenário, esta dissertação apresenta LigADOS, uma abordagem para estabelecer interligações entre conjuntos de dados considerando seu conteúdo e os metadados associados. LigADOS é baseada nos princípios da Web Semântica, associada a soluções de dados conectados e suas tecnologias, para criar interligações entre conjuntos de dados abertos, modelados como dados conectados e publicados em plataformas de dados abertos como o CKAN e outras. A viabilidade da proposta é avaliada através de um protótipo usando conjuntos de dados extraídos de instâncias de portais de dados reais. Sem o uso de LigADOS, são observáveis somente relações geradas entre conjuntos de dados, a partir de elementos de metadados coincidentes, que usualmente não estão associados a vocabulários, ontologias ou tesauros. LigADOS suporta a geração de diversas interligações entre os conjuntos de dados, que se baseiam em significados definidos em vocabulários, ontologias ou tesauros, fornecendo suporte para resultados mais expressivos em resposta a buscas e consultas, além do suporte à navegação pelas interligações de dados. Os resultados do uso de LigADOS sugerem que há interligações entre conjuntos de dados que não estão explícitas ao público em geral; assim como há conjuntos de dados que, inicialmente, parecem ter interrelações, mas ao se aprofundar na semântica dos dados, não se verificam as supostas interligações.