Prov-Dominoes: an exploratory analysis approach for provenance data

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Alencar, Victor Bezerra
Orientador(a): Murta, Leonardo Gresta Paulino, Silva Júnior, José Ricardo da, Murta, Vanessa Braganholo
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal Fluminense (UFF)
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
GPU
Link de acesso: https://www.repositorio.mar.mil.br/handle/ripcmb/845425
Resumo: Proveniência, o registro da história de uma informação, tem se tornado cada vez maisrelevante para a compreensão, auditoria e reprodução de tarefas computacionais. Os pro-cessos de análise de proveniência muitas vezes podem ser custosos para o usuário devidoao grande volume de dados, aos múltiplos relacionamentos e às informações implícitasem meio a esses dados. Algumas ferramentas existentes fornecem suporte à análise deproveniência com base em diagramas de vínculo entre nós, contando com recursos devisualização sobre arestas e vértices. Outras são ferramentas baseadas em fluxos de tra-balho, como VisTrails e Taverna. No entanto, nenhuma delas suporta a exploração dedados de proveniência implícitos, como as inferências das restrições do modelo de dadosPROV. Neste trabalho, apresentamos Prov-Dominoes, uma ferramenta projetada paraexplorar dados de proveniência interativamente. Prov-Dominoes promove as relações deproveniência entre entidades, atividades e agentes em elementos de primeira classe, repre-sentados por peças de dominó. Além disso, permite aos usuários combinar tais peças dedominó visual e interativamente, usando GPU. Prov-Dominoes foi avaliado em estudos decaso distintos a fim de observar sua relevância. Foi possível descobrir relações implícitasem um conjunto de dados de características de animais, identificar os parâmetros queinfluenciaram os resultados da execução de um fluxo de trabalho e destacar as atividadesessenciais em uma casa inteligente. Também avaliamos o desempenho de combinações se-quenciais executadas em Prov-Dominoes ao lidar com dados de proveniência com milharesde relações, contrastando suas execuções em GPU e CPU. Os resultados mostraram que,para um grande conjunto de dados, GPU superou CPU em duas ordens de magnitude.