RFlow: uma arquitetura para execução e coleta de proveniência de workflows estatísticos

Detalhes bibliográficos
Ano de defesa: 2015
Autor(a) principal: Nascimento, José Antônio Pires do lattes
Orientador(a): Cruz, Sérgio Manuel Serra da lattes
Banca de defesa: Cruz, Sérgio Manuel Serra da, Chaer, Guilherme Montandon, Costa, Raimundo José Macário
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal Rural do Rio de Janeiro
Programa de Pós-Graduação: Programa de Pós-Graduação em Modelagem Matemática e Computacional
Departamento: Instituto de Ciências Exatas
País: Brasil
Palavras-chave em Português:
Palavras-chave em Inglês:
Área do conhecimento CNPq:
Link de acesso: https://rima.ufrrj.br/jspui/handle/20.500.14407/14331
Resumo: Os dados agropecuários relacionados à redução de custos de produção e aumento da qualidade de produtos, previsão e controle de pragas e epidemias e agricultura de alta precisão são produzidos em grande escala e de maneira heterogênea e distribuída através de sensores, VANTs, web, satélites, dispositivos móveis, planilhas, entre outros. Este crescente aumento no volume de dados científicos e a necessidade de gerenciá-los e compartilhá-los entre equipes geograficamente dispersas têm demandado novas técnicas e ferramentas computacionais. Este trabalho apresenta a arquitetura RFlow, um conjunto de ferramentas integradas, com o intuito de gerenciar, compartilhar e reproduzir os experimentos científicos baseados em scripts R legados e, também, auxiliar a validar os resultados estatísticos junto à comunidade científica. O aplicativo SisGExp, um dos componentes da arquitetura, permite não só o acesso aos dados e os processos que os transformaram via online, bem como a coleta e registro dos descritores de proveniência sobre os experimentos. Além disso, vincula os dados de pesquisa aos resultados estatísticos, o que amplia a reprodutibilidade do experimento, oferecendo maior confiabilidade aos resultados científicos