Intra-node and Inter-node load balancing and other scalable approaches for high-performance seismic processing

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Assis, Italo Augusto Souza de
Orientador(a): Souza, Samuel Xavier de
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA E DE COMPUTAÇÃO
Departamento: Não Informado pela instituição
País: Brasil
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: https://repositorio.ufrn.br/jspui/handle/123456789/28353
Resumo: A modelagem sísmica, a migração reversa no tempo (RTM) e inversão de forma de onda multiescala (MFWI) são três das técnicas mais importantes no levantamento sísmico. A modelagem sísmica simula a propagação de ondas, a RTM gera uma imagem da subsuperfície e a MFWI produz um modelo de velocidades de propagação de ondas. Esses métodos possuem um alto custo computacional devido à grande quantidade de dados que eles processam e à complexidade de seus algoritmos. Por isso, na prática, eles são implementados apenas para sistemas paralelos. Embora existam implementações paralelas eficientes de modelagem, RTM e MFWI na literatura, melhorias podem ser feitas para melhor explorar o paralelismo nesses métodos e as características dos sistemas paralelos atuais. Esta pesquisa propõe a inversão de forma de onda multiescala acoplada (CMFWI), um método alternativo à MFWI, que melhora a escalabilidade paralela ao reduzir a dependência paralela entre o processamento de diferentes conteúdos de frequência dos dados. É apresentada uma implementação do CMFWI usando o método de minimizadores locais acoplados (CLM). Os resultados utilizando a norma L2 mostraram que a CMFWI teve desempenho inferior quando comparado ao MFWI. Esses testes indicam que mais pesquisa é necessária para implementar a CMFWI, pois ela compara dados com diferentes conteúdos de frequência. Este trabalho também apresenta uma estratégia de ajuste automático para escolher adequadamente o tamanho ideal dos blocos de carga de trabalho que reduz o tempo de execução de uma RTM 3D em sistemas de memória compartilhada. O método Coupled Simulated Annealing (CSA) é empregado para ajustar o tamanho dos blocos de carga de trabalho que os laços paralelos atribuem dinamicamente às threads. Testes mostram que o método proposto é consistentemente melhor do que dois agendamentos de laços padrão do OpenMP, sendo até 44% mais rápido. Esta tese também introduz o roubo de trabalho cíclico baseado em token (CTWS) para sistemas de memória distribuída. A nova abordagem de token cíclico reduz o número de falhas de roubo, reduz o overhead de comunicação e simplifica a seleção de vítimas e a estratégia de finalização. Os resultados obtidos com a aplicação da técnica proposta para equilibrar a carga de trabalho de uma RTM 3D apresentam um fator de 14,1% de aceleração e redução do desequilíbrio de carga de 78,4% quando comparadas à distribuição estática convencional. Por fim, é apresentada uma implementação de uma modelagem visco-acústica 2D.