Tratamento de grandes volumes de dados hidrometeorológicos apoiados por validação cruzada em Workflows científicos

Detalhes bibliográficos
Ano de defesa: 2016
Autor(a) principal: Tomaz, Ulisses Roque lattes
Orientador(a): Cruz, Sérgio Manuel Serra da lattes
Banca de defesa: Santos, Ednaldo Oliveira dos, Manhães, Laci Mari Barbosa
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal Rural do Rio de Janeiro
Programa de Pós-Graduação: Programa de Pós-Graduação em Modelagem Matemática e Computacional
Departamento: Instituto de Ciências Exatas
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://rima.ufrrj.br/jspui/handle/20.500.14407/14321
Resumo: Obtergrandes volumes de dados meteorológicos de qualidade e livre de falhas são grandes desafios para estudos climáticos ambientais.O estudo de dados pluviométricos é de grande importância no dia a dia, pois viabiliza o entendimento da variabilidade espacial da precipitação em uma região ou bacia hidrográfica o que possibilita determinar o período e avaliar a probabilidade da ocorrência de eventos extremos, sendo de suma importância para as ações associadas ao planejamento urbano, industrial e agropecuário, além do uso racional dos recursos hídricos.No Brasil, eles são obtidos a partir de estações meteorológicas, geograficamente distribuídasem todo território e fornecidos por vários órgãos, principalmente, peloInstituto Nacional de Meteorologia (INMET)e pela Agência Nacional de Águas (ANA).No entanto, obter dados estruturados curados de qualidade e livre de falhas é um problema que ainda é estudado por diversos autores. Assim, detectar e preencher as falhas encontradas nos dados é um passo importante para o controle de qualidade. Neste sentido, este trabalho estuda e aplica o método de validação cruzada para a seleção dos métodos de interpolação (regressão linear, ponderação regional, inverso do quadrado da distância e ponderação regional com base em regressões lineares) no preenchimento de falhasde longas séries de dados pelo uso em workflows científicos. Para controlar, integrar e produzir essa massa de dados curados, as tarefas de computação se apoiaram na execução de experimentos científicosin silico voltados para a área da Meteorologia baseadas no paradigma dos workflows científicos, que capturaram descritores de proveniência, que auxiliam na rastreabilidade dos dados e processos, e assim, revelam como foram produzidos, e, ainda, asseguram a qualidade da metodologia aplicada. Esta pesquisa propôs, modelou e avaliou umworkflow científico com base em experimentos computacionais capazes de manipular grandes volumes de dados meteorológicos brutos, transformando-os em curados e estabelecendo sua proveniência. Além disso, a proposta consiste em armazená-los na base de dados compatível com o sistema Meteoro desenvolvido previamente pelo nosso grupo de pesquisas.Neste processo foram analisados os dados hidrológicos de 34 estações pluviométricas (séries com no mínimo 10 anos), de 77 inicialmente selecionadas e,dentre os métodos avaliados o que apresentou melhores resultados foi o da ponderação regional (PR).