Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina

Detalhes bibliográficos
Autor(a) principal: Vieira, Marcos Aurélio
Data de Publicação: 2019
Tipo de documento: Trabalho de conclusão de curso
Idioma: por
Título da fonte: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Texto Completo: http://repositorio.utfpr.edu.br/jspui/handle/1/12515
Resumo: The use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes.
id UTFPR-12_80175c994e8e257c4c3e5cf04f768e68
oai_identifier_str oai:repositorio.utfpr.edu.br:1/12515
network_acronym_str UTFPR-12
network_name_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository_id_str
spelling Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquinaDetection of anomalies in public administration data using machine learning techniqueAprendizado do computadorMineração de dados (Computação)Linguagem de programação (Computadores)Machine learningData miningProgramming languages (Electronic computers)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes.O uso de aprendizado de máquina (AM) tem sido utilizado em diversas áreas da sociedade e organizações. Com isso diversas aplicações e descobertas tem surgido dessa área. O objetivo desse trabalho é encontrar anomalias em dados referente a gastos fornecidos pelas prefeituras utilizando técnicas de aprendizado de máquina e mineração de dados. Para o desenvolvimento desse trabalho, é utilizado a linguagem de programação Python,as bibliotecas, Pandas, NumPy, SciKit-learn. A primeira etapa realizada foi selecionar os dados que tenham algum tipo de correlação, assim optou-se por utilizar os dados do Sistema de Informação Contábil e Fiscal (SICONFI) do portal do Tesouro Nacional, mais especificamente os dados referente a gastos das prefeituras com educação, saúde, e segurança pública, entre outros atributos. Em seguida foram unificadas com dados do Índice Firjan de Gestão Fiscal (IFGF), Índice Firjan de Desenvolvimento Municipal (IFDM), dados do Departamento de Informática do Sistema Único de Saúde (DataSUS). Com essa nova proposta, novas anomalias de interesse foram encontradas. Outras cidades que, no experimento apenas com a base do SICONFI, eram consideradas como anomalias, nessa nova abordagem, passaram a não ser, e nos 10 casos analisados, o gasto dessas cidades eram justificados pelos índices propostos.Universidade Tecnológica Federal do ParanáMedianeiraBrasilCiência da ComputaçãoUTFPRPessini, Evando CarlosCandido Junior, ArnaldoPessini, Evando CarlosGavioli, AlanSchütz, FernandoAikes Junior, JorgeVieira, Marcos Aurélio2020-11-16T13:09:34Z2020-11-16T13:09:34Z2019-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfVIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/12515porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2020-11-16T13:09:34Zoai:repositorio.utfpr.edu.br:1/12515Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-11-16T13:09:34Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false
dc.title.none.fl_str_mv Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
Detection of anomalies in public administration data using machine learning technique
title Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
spellingShingle Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
Vieira, Marcos Aurélio
Aprendizado do computador
Mineração de dados (Computação)
Linguagem de programação (Computadores)
Machine learning
Data mining
Programming languages (Electronic computers)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
title_short Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
title_full Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
title_fullStr Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
title_full_unstemmed Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
title_sort Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
author Vieira, Marcos Aurélio
author_facet Vieira, Marcos Aurélio
author_role author
dc.contributor.none.fl_str_mv Pessini, Evando Carlos
Candido Junior, Arnaldo
Pessini, Evando Carlos
Gavioli, Alan
Schütz, Fernando
Aikes Junior, Jorge
dc.contributor.author.fl_str_mv Vieira, Marcos Aurélio
dc.subject.por.fl_str_mv Aprendizado do computador
Mineração de dados (Computação)
Linguagem de programação (Computadores)
Machine learning
Data mining
Programming languages (Electronic computers)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
topic Aprendizado do computador
Mineração de dados (Computação)
Linguagem de programação (Computadores)
Machine learning
Data mining
Programming languages (Electronic computers)
CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO
description The use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes.
publishDate 2019
dc.date.none.fl_str_mv 2019-07-08
2020-11-16T13:09:34Z
2020-11-16T13:09:34Z
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/bachelorThesis
format bachelorThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv VIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019.
http://repositorio.utfpr.edu.br/jspui/handle/1/12515
identifier_str_mv VIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019.
url http://repositorio.utfpr.edu.br/jspui/handle/1/12515
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Medianeira
Brasil
Ciência da Computação
UTFPR
publisher.none.fl_str_mv Universidade Tecnológica Federal do Paraná
Medianeira
Brasil
Ciência da Computação
UTFPR
dc.source.none.fl_str_mv reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
instname:Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
instname_str Universidade Tecnológica Federal do Paraná (UTFPR)
instacron_str UTFPR
institution UTFPR
reponame_str Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
collection Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
repository.name.fl_str_mv Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)
repository.mail.fl_str_mv riut@utfpr.edu.br || sibi@utfpr.edu.br
_version_ 1850497908967735296