Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2019 |
| Tipo de documento: | Trabalho de conclusão de curso |
| Idioma: | por |
| Título da fonte: | Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| Texto Completo: | http://repositorio.utfpr.edu.br/jspui/handle/1/12515 |
Resumo: | The use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes. |
| id |
UTFPR-12_80175c994e8e257c4c3e5cf04f768e68 |
|---|---|
| oai_identifier_str |
oai:repositorio.utfpr.edu.br:1/12515 |
| network_acronym_str |
UTFPR-12 |
| network_name_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository_id_str |
|
| spelling |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquinaDetection of anomalies in public administration data using machine learning techniqueAprendizado do computadorMineração de dados (Computação)Linguagem de programação (Computadores)Machine learningData miningProgramming languages (Electronic computers)CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAOThe use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes.O uso de aprendizado de máquina (AM) tem sido utilizado em diversas áreas da sociedade e organizações. Com isso diversas aplicações e descobertas tem surgido dessa área. O objetivo desse trabalho é encontrar anomalias em dados referente a gastos fornecidos pelas prefeituras utilizando técnicas de aprendizado de máquina e mineração de dados. Para o desenvolvimento desse trabalho, é utilizado a linguagem de programação Python,as bibliotecas, Pandas, NumPy, SciKit-learn. A primeira etapa realizada foi selecionar os dados que tenham algum tipo de correlação, assim optou-se por utilizar os dados do Sistema de Informação Contábil e Fiscal (SICONFI) do portal do Tesouro Nacional, mais especificamente os dados referente a gastos das prefeituras com educação, saúde, e segurança pública, entre outros atributos. Em seguida foram unificadas com dados do Índice Firjan de Gestão Fiscal (IFGF), Índice Firjan de Desenvolvimento Municipal (IFDM), dados do Departamento de Informática do Sistema Único de Saúde (DataSUS). Com essa nova proposta, novas anomalias de interesse foram encontradas. Outras cidades que, no experimento apenas com a base do SICONFI, eram consideradas como anomalias, nessa nova abordagem, passaram a não ser, e nos 10 casos analisados, o gasto dessas cidades eram justificados pelos índices propostos.Universidade Tecnológica Federal do ParanáMedianeiraBrasilCiência da ComputaçãoUTFPRPessini, Evando CarlosCandido Junior, ArnaldoPessini, Evando CarlosGavioli, AlanSchütz, FernandoAikes Junior, JorgeVieira, Marcos Aurélio2020-11-16T13:09:34Z2020-11-16T13:09:34Z2019-07-08info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesisapplication/pdfVIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019.http://repositorio.utfpr.edu.br/jspui/handle/1/12515porinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))instname:Universidade Tecnológica Federal do Paraná (UTFPR)instacron:UTFPR2020-11-16T13:09:34Zoai:repositorio.utfpr.edu.br:1/12515Repositório InstitucionalPUBhttp://repositorio.utfpr.edu.br:8080/oai/requestriut@utfpr.edu.br || sibi@utfpr.edu.bropendoar:2020-11-16T13:09:34Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR)false |
| dc.title.none.fl_str_mv |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina Detection of anomalies in public administration data using machine learning technique |
| title |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
| spellingShingle |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina Vieira, Marcos Aurélio Aprendizado do computador Mineração de dados (Computação) Linguagem de programação (Computadores) Machine learning Data mining Programming languages (Electronic computers) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| title_short |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
| title_full |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
| title_fullStr |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
| title_full_unstemmed |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
| title_sort |
Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina |
| author |
Vieira, Marcos Aurélio |
| author_facet |
Vieira, Marcos Aurélio |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Pessini, Evando Carlos Candido Junior, Arnaldo Pessini, Evando Carlos Gavioli, Alan Schütz, Fernando Aikes Junior, Jorge |
| dc.contributor.author.fl_str_mv |
Vieira, Marcos Aurélio |
| dc.subject.por.fl_str_mv |
Aprendizado do computador Mineração de dados (Computação) Linguagem de programação (Computadores) Machine learning Data mining Programming languages (Electronic computers) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| topic |
Aprendizado do computador Mineração de dados (Computação) Linguagem de programação (Computadores) Machine learning Data mining Programming languages (Electronic computers) CNPQ::CIENCIAS EXATAS E DA TERRA::CIENCIA DA COMPUTACAO |
| description |
The use of Machine Learning (ML) has been used in several areas of society and organizations. With this several applications and discoveries have arisen from this area. The objective of this work is to find data anomalies related to expenditures provided by municipalities using techniques of machine learning and data mining. For the development of this work, the Python programming language, libraries, Pandas, NumPy, SciKit-learn is used. The first step was to select the data that have some type of correlation, so we chose to use the data from the Accounting and Fiscal Information System (SICONFI) of the National Treasury portal, more specifically data on municipalities’ spending on education , health, and public safety, among other attributes. They were then unified with data from the Firjan Index of Fiscal Management (IFGF), Firjan Municipal Development Index (IFDM), data from the Department of Information Technology of the Unified Health System (DataSUS). With this new proposal, new anomalies of interest were found. Other cities that, in the experiment with only the SICONFI base, were considered anomalies in this new approach, except in the ten cases analyzed, the expenditure of these cities was justified by the proposed indexes. |
| publishDate |
2019 |
| dc.date.none.fl_str_mv |
2019-07-08 2020-11-16T13:09:34Z 2020-11-16T13:09:34Z |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
VIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019. http://repositorio.utfpr.edu.br/jspui/handle/1/12515 |
| identifier_str_mv |
VIEIRA, Marcos Aurélio. Detecção de anomalias em dados da administração pública utilizando técnica de aprendizado de máquina. 2019. Trabalho de Conclusão de Curso – (Bacharelado em Ciência da Computação) - Universidade Tecnológica Federal do Paraná, Medianeira, 2019. |
| url |
http://repositorio.utfpr.edu.br/jspui/handle/1/12515 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Medianeira Brasil Ciência da Computação UTFPR |
| publisher.none.fl_str_mv |
Universidade Tecnológica Federal do Paraná Medianeira Brasil Ciência da Computação UTFPR |
| dc.source.none.fl_str_mv |
reponame:Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) instname:Universidade Tecnológica Federal do Paraná (UTFPR) instacron:UTFPR |
| instname_str |
Universidade Tecnológica Federal do Paraná (UTFPR) |
| instacron_str |
UTFPR |
| institution |
UTFPR |
| reponame_str |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| collection |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) |
| repository.name.fl_str_mv |
Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT)) - Universidade Tecnológica Federal do Paraná (UTFPR) |
| repository.mail.fl_str_mv |
riut@utfpr.edu.br || sibi@utfpr.edu.br |
| _version_ |
1850497908967735296 |