A mechanism to evaluate context-free queries inspired in LR(1) parsers over graph databases

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Santos, Fred de Castro
Orientador(a): Costa, Umberto Souza da
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
RDF
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/24970
Resumo: A World Wide Web é uma coleção de informações sempre crescente. Esta informação é distribuída entre documentos diferentes, disponibilizados através do HTTP. Mesmo que essa informação seja acessível aos usuários na forma de artigos de notícias, transmissões de áudio, imagens e vídeos, os agentes de software geralmente não podem classificá-la. A falta de informações semânticas sobre esses documentos em um formato legível por máquina geralmente faz com que a análise seja imprecisa. Um número significativo de entidades adotaram Linked Data como uma forma de adicionar informações semânticas aos seus dados, e não apenas publicá-lo na Web. O resultado é uma coleção global de dados, chamada Web of Data, que forma um grafo global, composto por declarações no formato RDF [22] de diversas fontes, cobrindo todos os tipos de tópicos. Para encontrar informações específicas nesses grafos, as consultas são realizadas começando em um sujeito e analisando seus predicados nas instruções RDF. Esses predicados são as conexões entre o sujeito e o objeto, e um conjunto de trilhas forma um caminho de informação. O uso de HTTP como mecanismo padrão de acesso a dados e RDF como modelo de dados padrão simplifica o acesso a dados, o que nos motiva a pesquisar alternativas na forma como esses dados são buscados. Uma vez que a maioria das linguagens de consulta de banco de dados de grafo estão na classe de Linguagens Regulares, nós propomos seguir um caminho diferente e tentar usar uma classe de gramática menos restritiva, chamada Gramática Livre de Contexto Determinística, para aumentar a expressividade das consultas no banco de dados em grafo. Mais especificamente, aplicando o método de análise LR(1) para encontrar caminhos em um banco de dados de grafo RDF. O principal objetivo deste trabalho é prover meios para se permitir a utilização de técnicas de reconhecimento de gramáticas livres de contexto LR(1) para fazer consultas por caminhos formados pelas etiquetas das arestas em um banco de dados RDF. Fornecendo, como um resultado, uma ferramenta que se permita atingir melhor expressividade, eficiência e escalabilidade nestas consultas do que o que existe atualmente. Para atingir este objetivo, nós implementamos um algoritmo baseado nas técnicas de reconhecimento LR(1), usando o GSS [30] ao invés de uma pilha, e permitimos ao usuário fazer consultas com uma gramática livre de contexto (LR1). Também analisamos a complexidade do nosso algoritmo e executamos alguns experimentos, comparando nossa solução com as outras propostas na literatura, mostrando que a nossa pode ter melhor desempenho em alguns cenários.