Geoprocessing with NoSQL databases and MapReduce

Detalhes bibliográficos
Autor(a) principal: de Almeida, Dayse Silveira
Data de Publicação: 2023
Outros Autores: da Silva, Adriano Lopes Leão
Tipo de documento: Artigo
Idioma: por
Título da fonte: Revista Brasileira de Geomática
Texto Completo: https://periodicos.utfpr.edu.br/rbgeo/article/view/15927
Resumo: Geospatial information has been relevant for several applications. In the context of monitoring environmental degradation, geospatial data normally collected by sensors present in satellites, map fires, deforested areas, and others. These data are collected continuously for long periods of time and in great detail, thus generating large volumes. Over the past few decades, this data has been stored mainly in relational databases. To attend the current requirements for large-scale data from different sources, processing in real time and with high concurrency, NoSQL databases are proving to be a better alternative. These database systems are normally distributed, do not require structured data, and are designed for horizontal scalability. However, there is still a deficiency of NoSQL databases in terms of spatial functions. Therefore, the purpose in this paper is to review the NoSQL databases in order to verify its support for geospatial data. The NoSQL databases that have been highlighted in the literature and have been shown to be more suitable for the management of large geographic data are those based on documents, due the wide support for geometric data formats, indexes, geospatial functions, and also due the high computational performance. In addition to these, the MapReduce distributed processing model also highlights for the possibility of creating mapping and reduction functions for geospatial data and taking advantage of the high computational performance platforms that follow this model.
id UTFPR-14_abae0946a08d28c8d1859802cca2abdb
oai_identifier_str oai:periodicos.utfpr:article/15927
network_acronym_str UTFPR-14
network_name_str Revista Brasileira de Geomática
repository_id_str
spelling Geoprocessing with NoSQL databases and MapReduceGeoprocessamento com banco de dados NoSQL e MapReduceCiências Exatas e da Terra /Ciência da Computação /Metodologia e Técnicas da Computação /Banco de DadosDados Geoespaciais; Dados Abertos; Bancos de Dados NoSQL; MapReduceGeospatial Data; Open Data; NoSQL Databases; MapReduceGeospatial information has been relevant for several applications. In the context of monitoring environmental degradation, geospatial data normally collected by sensors present in satellites, map fires, deforested areas, and others. These data are collected continuously for long periods of time and in great detail, thus generating large volumes. Over the past few decades, this data has been stored mainly in relational databases. To attend the current requirements for large-scale data from different sources, processing in real time and with high concurrency, NoSQL databases are proving to be a better alternative. These database systems are normally distributed, do not require structured data, and are designed for horizontal scalability. However, there is still a deficiency of NoSQL databases in terms of spatial functions. Therefore, the purpose in this paper is to review the NoSQL databases in order to verify its support for geospatial data. The NoSQL databases that have been highlighted in the literature and have been shown to be more suitable for the management of large geographic data are those based on documents, due the wide support for geometric data formats, indexes, geospatial functions, and also due the high computational performance. In addition to these, the MapReduce distributed processing model also highlights for the possibility of creating mapping and reduction functions for geospatial data and taking advantage of the high computational performance platforms that follow this model.Informação geoespacial tem sido de grande importância para diversas aplicações. No contexto de monitoramento de degradações ambientais, os dados geoespaciais, normalmente coletados por sensores presentes em satélites, mapeiam focos de queimadas, áreas desmatadas, entre outros. Esses dados são coletados continuamente por longos períodos de tempo e com riqueza de detalhes, gerando assim, grandes volumes. Ao longo das últimas décadas, esses dados foram armazenados principalmente em bancos de dados relacionais. Para atender aos requisitos atuais, de dados em larga escala advindos de diferentes fontes, de tempo real e de alta concorrência, os bancos de dados NoSQL vêm se mostrando como uma melhor alternativa. Esses sistemas de banco de dados normalmente são distribuídos, não requerem dados estruturados, e são desenvolvidos para escalabilidade horizontal. No entanto, há ainda certa deficiência dos bancos de dados NoSQL em termos de funções espaciais. Sendo assim, o objetivo neste artigo é fazer uma revisão sobre os bancos de dados NoSQL a fim de se verificar o suporte desses aos dados geoespaciais. Os bancos de dados NoSQL que têm se destacado na literatura e se mostrado mais adequados para o gerenciamento dos dados geográficos volumosos são os orientados aos documentos, devido ao maior suporte aos formatos de dados geométricos, aos índices, às funções geoespaciais, e devido também ao alto desempenho computacional. Além desses, se destaca também o modelo de processamento distribuído MapReduce pela possibilidade de se criar funções de mapeamento e de redução para dados geoespaciais e tirar proveito das plataformas de alto desempenho computacional que seguem esse modelo.Universidade Tecnológica Federal do Paraná (UTFPR)de Almeida, Dayse Silveirada Silva, Adriano Lopes Leão2023-09-25info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://periodicos.utfpr.edu.br/rbgeo/article/view/1592710.3895/rbgeo.v11n2.15927Revista Brasileira de Geomática; v. 11, n. 2 (2023); 441-464Revista Brasileira de Geomática; v. 11, n. 2 (2023); 441-4642317-428510.3895/rbgeo.v11n2reponame:Revista Brasileira de Geomáticainstname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRporhttps://periodicos.utfpr.edu.br/rbgeo/article/view/15927/9805Direitos autorais 2023 CC-BYinfo:eu-repo/semantics/openAccess2023-12-07T18:28:48Zoai:periodicos.utfpr:article/15927Revistahttps://periodicos.utfpr.edu.br/rbgeoPUBhttps://periodicos.utfpr.edu.br/rbgeo/oairbgeo-pb@utfpr.edu.br || rodriguesaguiar@utfpr.edu.br || periodicos@utfpr.edu.br2317-42852317-4285opendoar:2023-12-07T18:28:48Revista Brasileira de Geomática - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Geoprocessing with NoSQL databases and MapReduce
Geoprocessamento com banco de dados NoSQL e MapReduce
title Geoprocessing with NoSQL databases and MapReduce
spellingShingle Geoprocessing with NoSQL databases and MapReduce
de Almeida, Dayse Silveira
Ciências Exatas e da Terra /Ciência da Computação /Metodologia e Técnicas da Computação /Banco de Dados
Dados Geoespaciais; Dados Abertos; Bancos de Dados NoSQL; MapReduce
Geospatial Data; Open Data; NoSQL Databases; MapReduce
title_short Geoprocessing with NoSQL databases and MapReduce
title_full Geoprocessing with NoSQL databases and MapReduce
title_fullStr Geoprocessing with NoSQL databases and MapReduce
title_full_unstemmed Geoprocessing with NoSQL databases and MapReduce
title_sort Geoprocessing with NoSQL databases and MapReduce
author de Almeida, Dayse Silveira
author_facet de Almeida, Dayse Silveira
da Silva, Adriano Lopes Leão
author_role author
author2 da Silva, Adriano Lopes Leão
author2_role author
dc.contributor.none.fl_str_mv

dc.contributor.author.fl_str_mv de Almeida, Dayse Silveira
da Silva, Adriano Lopes Leão
dc.subject.por.fl_str_mv Ciências Exatas e da Terra /Ciência da Computação /Metodologia e Técnicas da Computação /Banco de Dados
Dados Geoespaciais; Dados Abertos; Bancos de Dados NoSQL; MapReduce
Geospatial Data; Open Data; NoSQL Databases; MapReduce
topic Ciências Exatas e da Terra /Ciência da Computação /Metodologia e Técnicas da Computação /Banco de Dados
Dados Geoespaciais; Dados Abertos; Bancos de Dados NoSQL; MapReduce
Geospatial Data; Open Data; NoSQL Databases; MapReduce
description Geospatial information has been relevant for several applications. In the context of monitoring environmental degradation, geospatial data normally collected by sensors present in satellites, map fires, deforested areas, and others. These data are collected continuously for long periods of time and in great detail, thus generating large volumes. Over the past few decades, this data has been stored mainly in relational databases. To attend the current requirements for large-scale data from different sources, processing in real time and with high concurrency, NoSQL databases are proving to be a better alternative. These database systems are normally distributed, do not require structured data, and are designed for horizontal scalability. However, there is still a deficiency of NoSQL databases in terms of spatial functions. Therefore, the purpose in this paper is to review the NoSQL databases in order to verify its support for geospatial data. The NoSQL databases that have been highlighted in the literature and have been shown to be more suitable for the management of large geographic data are those based on documents, due the wide support for geometric data formats, indexes, geospatial functions, and also due the high computational performance. In addition to these, the MapReduce distributed processing model also highlights for the possibility of creating mapping and reduction functions for geospatial data and taking advantage of the high computational performance platforms that follow this model.
publishDate 2023
dc.date.none.fl_str_mv 2023-09-25
dc.type.none.fl_str_mv

dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://periodicos.utfpr.edu.br/rbgeo/article/view/15927
10.3895/rbgeo.v11n2.15927
url https://periodicos.utfpr.edu.br/rbgeo/article/view/15927
identifier_str_mv 10.3895/rbgeo.v11n2.15927
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://periodicos.utfpr.edu.br/rbgeo/article/view/15927/9805
dc.rights.driver.fl_str_mv Direitos autorais 2023 CC-BY
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Direitos autorais 2023 CC-BY
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná (UTFPR)
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná (UTFPR)
dc.source.none.fl_str_mv Revista Brasileira de Geomática; v. 11, n. 2 (2023); 441-464
Revista Brasileira de Geomática; v. 11, n. 2 (2023); 441-464
2317-4285
10.3895/rbgeo.v11n2
reponame:Revista Brasileira de Geomática
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Revista Brasileira de Geomática
collection Revista Brasileira de Geomática
repository.name.fl_str_mv Revista Brasileira de Geomática - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv rbgeo-pb@utfpr.edu.br || rodriguesaguiar@utfpr.edu.br || periodicos@utfpr.edu.br
_version_ 1833827571533348864