Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data

Bibliographic Details
Main Author: Almeida, Lucas Hauptmann de
Publication Date: 2014
Format: Bachelor thesis
Language: por
Source: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Download full: http://repositorio.utfpr.edu.br/jspui/handle/1/9296
Summary: The constant evolution of computing and computational capabilities of hardware devices allows more data to be stored and used in several different ways. However, despite this diversity, all applications share the same objective: to be able to obtain value from available data, processing it and generating more meaningful new data. This new process is called Big Data. In the atmospherical science field, the Big Data is present to feed different needs. Among these needs there is the need to analyze and forecast air pollution data. In this context, this document presents a Big Data system able to efficiently retrieve data, using it in different statistical analysis and forecast methods. The data was obtained from the United States Environmental Protection Agency website, then it was stored in a NoSQL database, which allows the efficient utilization. The analysis and forecast methods were developed using the programming language R, which facilitates the use of time series techniques and models. The final version of the system has a web interface to access the analyses. At the end, case studies are presented to demonstrate possible analyzes that can be executed in the system. Also, suggestions for future work are presented in order to continue the research that begins in this document.
id UTFPR-12_edc94030ea3ecd42f1b07147c068e03a
oai_identifier_str oai:repositorio.utfpr.edu.br:1/9296
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big DataBanco de dadosEstatística - AnáliseEstatística - PrevisãoAr - Poluição - MediçãoData basesStatistics - AnalysisStatistics - ForecastingAir - Pollution - MeasurementSistemas de InformaçãoThe constant evolution of computing and computational capabilities of hardware devices allows more data to be stored and used in several different ways. However, despite this diversity, all applications share the same objective: to be able to obtain value from available data, processing it and generating more meaningful new data. This new process is called Big Data. In the atmospherical science field, the Big Data is present to feed different needs. Among these needs there is the need to analyze and forecast air pollution data. In this context, this document presents a Big Data system able to efficiently retrieve data, using it in different statistical analysis and forecast methods. The data was obtained from the United States Environmental Protection Agency website, then it was stored in a NoSQL database, which allows the efficient utilization. The analysis and forecast methods were developed using the programming language R, which facilitates the use of time series techniques and models. The final version of the system has a web interface to access the analyses. At the end, case studies are presented to demonstrate possible analyzes that can be executed in the system. Also, suggestions for future work are presented in order to continue the research that begins in this document.A constante evolução da computação e da capacidade computacional dos dispositivos de hardware permite que mais dados sejam armazenados e utilizados das mais diversas formas. No entanto, apesar da diversidade, aplicações desta natureza apresentam o mesmo objetivo: agregar valor a partir dos dados disponíveis, processando-os e gerando novos dados mais ricos em significado. Este novo processo é chamado de Big Data. Nas ciências atmosféricas, a Big Data está presente para suprir diferentes necessidades. Entre elas, encontra-se a necessidade de analisar e prever dados de poluição do ar. Neste contexto, este trabalho tem como objetivo apresentar um sistema para Big Data capaz de recuperar dados de forma eficiente, utilizando os em m´métodos estatísticos de análise e previsão. Os dados foram obtidos da base de dados da Agência de Proteção Ambiental dos Estados Unidos, em seguida foram armazenados em um banco de dados NoSQL, que permitiu a utilização eficiente. Os métodos de análise e previsão foram desenvolvidos na linguagem de programação R, a qual facilita o uso de técnicas e modelos de séries temporais. A versão final do sistema apresenta uma interface web para acesso às análises. Ao final, são apresentados estudos de casos para demonstrar as possíveis análises que podem ser realizadas utilizando o sistema. Também são apresentados sugestões para trabalhos futuros afim de continuar a pesquisa iniciada neste documento.Universidade Tecnológica Federal do ParanáCuritibaDepartamento Acadêmico de InformáticaCavalcanti, Eteocles da SilvaThé, JesseAlmeida, Lucas Hauptmann de2020-11-12T12:04:12Z2020-11-12T12:04:12Z2014-08-26info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfALMEIDA, Lucas Hauptmann de. Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data. 2014. 104 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2014.http://repositorio.utfpr.edu.br/jspui/handle/1/9296porreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPRinfo:eu-repo/semantics/openAccess2020-11-12T12:04:13Zoai:repositorio.utfpr.edu.br:1/9296Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-11-12T12:04:13Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
title Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
spellingShingle Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
Almeida, Lucas Hauptmann de
Banco de dados
Estatística - Análise
Estatística - Previsão
Ar - Poluição - Medição
Data bases
Statistics - Analysis
Statistics - Forecasting
Air - Pollution - Measurement
Sistemas de Informação
title_short Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
title_full Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
title_fullStr Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
title_full_unstemmed Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
title_sort Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data
author Almeida, Lucas Hauptmann de
author_facet Almeida, Lucas Hauptmann de
author_role author
dc.contributor.none.fl_str_mv Cavalcanti, Eteocles da Silva
Thé, Jesse
dc.contributor.author.fl_str_mv Almeida, Lucas Hauptmann de
dc.subject.por.fl_str_mv Banco de dados
Estatística - Análise
Estatística - Previsão
Ar - Poluição - Medição
Data bases
Statistics - Analysis
Statistics - Forecasting
Air - Pollution - Measurement
Sistemas de Informação
topic Banco de dados
Estatística - Análise
Estatística - Previsão
Ar - Poluição - Medição
Data bases
Statistics - Analysis
Statistics - Forecasting
Air - Pollution - Measurement
Sistemas de Informação
description The constant evolution of computing and computational capabilities of hardware devices allows more data to be stored and used in several different ways. However, despite this diversity, all applications share the same objective: to be able to obtain value from available data, processing it and generating more meaningful new data. This new process is called Big Data. In the atmospherical science field, the Big Data is present to feed different needs. Among these needs there is the need to analyze and forecast air pollution data. In this context, this document presents a Big Data system able to efficiently retrieve data, using it in different statistical analysis and forecast methods. The data was obtained from the United States Environmental Protection Agency website, then it was stored in a NoSQL database, which allows the efficient utilization. The analysis and forecast methods were developed using the programming language R, which facilitates the use of time series techniques and models. The final version of the system has a web interface to access the analyses. At the end, case studies are presented to demonstrate possible analyzes that can be executed in the system. Also, suggestions for future work are presented in order to continue the research that begins in this document.
publishDate 2014
dc.date.none.fl_str_mv 2014-08-26
2020-11-12T12:04:12Z
2020-11-12T12:04:12Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv ALMEIDA, Lucas Hauptmann de. Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data. 2014. 104 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2014.
http://repositorio.utfpr.edu.br/jspui/handle/1/9296
identifier_str_mv ALMEIDA, Lucas Hauptmann de. Sistema para análise e previsão estatística de indicadores ambientais de poluição do ar no contexto de Big Data. 2014. 104 f. Trabalho de Conclusão de Curso (Graduação) – Universidade Tecnológica Federal do Paraná, Curitiba, 2014.
url http://repositorio.utfpr.edu.br/jspui/handle/1/9296
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Departamento Acadêmico de Informática
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Curitiba
Departamento Acadêmico de Informática
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850497834302832640