Tratamento e preenchimento de falhas de séries de dados meteorológicos utilizando workflows científicos paralelos em ambientes de GPU

Detalhes bibliográficos
Ano de defesa: 2014
Autor(a) principal: Silva, Fábio Cardozo da lattes
Orientador(a): Cruz, Sérgio Manuel Serra da
Banca de defesa: Cruz, Sérgio Manuel Serra da, Goldschmidt, Ronaldo Ribeiro, Lyra, Gustavo Bastos
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal Rural do Rio de Janeiro
Programa de Pós-Graduação: Programa de Pós-Graduação em Modelagem Matemática e Computacional
Departamento: Instituto de Ciências Exatas
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://rima.ufrrj.br/jspui/handle/20.500.14407/14327
Resumo: Juntamente com a crescente importância das pesquisas na área de meteorologia e climatologia, principalmente as que manipulam grandes volumes de dados voltados aos estudos dos recursos hídricos, surgem as dificuldades para que os pesquisadores dessas áreas obtenham e armazenem dados de alta qualidade em seus repositórios. Este trabalho tem como objetivo apresentar uma proposta na área computacional capaz de processar dados meteorológicos agregando controle de qualidade a longas séries históricas de dados em hidrologia. Os artefatos deste trabalho são baseados na visão da e-Science, utilizando workflows científicos em ambientes de processamento de alto desempenho que tem por finalidade automatizar parte das etapas de pesquisas científicas em meteorologia. Além disso, este trabalho propõe a integração de workflows científicos desenvolvidos na plataforma VisTrails com a computação paralela em ambientes GPU utilizando códigos CUDA. Essa integração visa ampliar a capacidade de manipulação de grandes volumes de dados hidrológicos. Outra característica desse trabalho são a apresentação dos ganhos de desempenho da solução computacional e a representação dos dados relativos à proveniência retrospectiva dos experimentos segundo os moldes da especificação PROV-DM. Como um dos principais resultados temos o índice de identificação e correção de falhas de 87,7%, nos testes realizados com 77 estações, o que representa um ganho precioso de tempo na preparação de dados nas pesquisas da área. Com isso pode-se concluir que a combinação da visão da e-Ciência associada a tecnologia de computação paralela CUDA, além de viável, se torna uma alternativa no tratamento de grandes volumes de dados na área de Meteorologia e Climatologia.