SimDB: :simulações numéricas em modelo de dados de matrizes multidimensionais
Ano de defesa: | 2014 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Laboratório Nacional de Computação Cientifica
Serviço de Análise e Apoio a Formação de Recursos Humanos BR LNCC Programa de Pós-Graduação em Modelagem Computacional |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | https://tede.lncc.br/handle/tede/183 |
Resumo: | Modelagem Computacional e uma area na qual cientistas concebem modelos matematicos para reproduzir o comportamento de um fenomeno estudado. Por meio de simulacoes computacionais, variaveis dependentes do modelo sao calculadas, ao longo de uma amostra multidimensional espaco-temporal. O estado da arte em simulacoes numericas adota um tipo de softwares, chamado Resolvedor numerico (Solver), de forma a resolver equacoes matematicas e calcular os valores das variaveis dependentes. Para orientar o calculo no espaco do dominio fsico, malhas poligonais identicam os pontos onde os valores devem ser computados, enquanto que a dimensao temporal introduz a dinamica do sistema, indicando valores sucessivos para o mesmo ponto da malha. Finalmente, a m de testar o modelo com diferentes conjuntos de parametros, cientistas podem executar uma serie de simulacoes. Apesar da enorme quantidade de dados produzidos por tais simulacoes, o processo nao tem apoio de solucoes ecientes para o gerenciamento dos dados. Uma implementacao tipica armazena parametros e dados simulados em arquivos de texto simples, organizados em uma estrutura de diretorios, sem o interesse de permitir o uso de linguagem de consulta de alto nivel e o processamento distribuido de consultas. Neste contexto, esta tese investiga a adocao do Modelo de dados de Matrizes Multidimensionais e sua implementacao atraves do Sistema Gerenciador de Bancos de Dados SciDB, para gerenciar os dados de simulacao numerica. Modelamos as dimensoes espaco-temporais e a simulacao como indices da matriz em um Modelo de Dados de Matrizes Multidimensionais e suas variaveis dependentes como atributos de celulas. Apresentamos uma nova estrategia para mapear a representacao de pontos em malhas nao ortogonais para estruturas em array. Um conjunto orquestrado de transformacoes espaciais fazem o mapeamento do modelo espacial original em um array multidimensional denso, reduzindo radicalmente o numero de particoes (chunks) esparsas produzidas por um mapeamento simples. Nossa estrategia e particularmente interessante para consultas realizadas sobre um fragmento grande do array. Realizamos uma serie de experimentos sobre um cenario real, provido por simulacoes do sistema cardiovascular humano, desenvolvido no LNCC. Mostramos que em algumas consultas, obtem-se um desempenho 25 vezes melhor no tempo de resposta realizado sobre consultas de usuario, em comparaçao com a implementacao padrao usando o SciDB. |