Similaridade semântica de atributos para dados em nuvem: um estudo de caso no MIDAS

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Rocha, Witã dos Santos
Orientador(a): Claro, Daniela Barreiro
Banca de defesa: Siqueira, Frank Augusto, Salvador, Laís do Nascimento
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal da Bahia
Instituto de Matemática e Estatística
Departamento de Ciência da Computação
Programa de Pós-Graduação: em Ciência da Computação
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://repositorio.ufba.br/ri/handle/ri/33461
Resumo: Grande quantidade de dados heterogêneos produzidos pelas redes sociais, dispositivos conectados na Internet e aplicações web vem sendo gerados, armazenados e gerenciados em formatos diferentes nos níveis de serviços Data-as-a-Service (DaaS ou Dado como um Serviço) e Database-as-a-Service (DBaaS ou Bancos de Dados como um Serviço) distintos. Tais soluções fornecem os dados como serviços sob demanda via Application Programming Interface (API). Para acessar esses serviços distribuídos entre as nuvens, os usuários enfrentam, na maioria dos casos, problemas de ambiguidade de dados. Nesse sentido é necessário prover uma solução automática que sirva como camada intermediária para estabelecer a comunicação entre os níveis de serviços SaaS e DaaS/DBaaS, de modo que resolva esses problemas evitando a execução de tarefas complexas e trabalhosas para acessar esses dados. Esta solução permite que os consumidores no nível de serviço SaaS acessem seus dados armazenados em diferentes níveis de serviços DaaS por meio de uma única consulta. A camada intermediária denominada Middleware for Interoperability Between SaaS and DaaS (MIDAS) fornece essa solução aos usuários de uma forma transparente. Com o tempo, as atualizações dos parâmetros dos níveis de serviços DaaS podem afetar semanticamente os termos das consultas configurados (automaticamente ou não) nos aplicativos nos níveis de serviços SaaS. Para garantir que os consumidores da nuvem continuem acessando os dados do DaaS, recomenda-se uma abordagem que garanta semelhança semântica entre os parâmetros do DaaS para manter a confiabilidade da solicitação original. Este trabalho propõe um método com duas avaliações de similaridade: (i) a contagem de arestas (Cosseno e Jaccard) para medir a semelhança entre dois parâmetros e a Information Content (IC) para medir a semelhança com base no conhecimento dos parâmetros no corpus da WordNet. O método IC é utilizado no modelo com o objetivo de completar as limitações do método de contagem de arestas. Para escolher os métodos de contagem de arestas (Cosseno e Jaccard), um ambiente com oito algoritmos de medida de distância, vinte e dois parâmetros autênticos de onze provedores de DaaS e cinco situações possíveis de alteração de parâmetros foram simulados. Como prova de conceito, este modelo é implementado no MIDAS para avaliar três critérios: sobrecarga, desempenho e corretude. Os resultados dos experimentos mostraram que há uma primeira direção para fornecer interoperabilidade semântica entre SaaS e DaaS no MIDAS.