Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
Main Author: | |
---|---|
Publication Date: | 2018 |
Other Authors: | , |
Format: | Article |
Language: | por |
Source: | Brazilian Journal of Information Systems |
Download full: | https://journals-sol.sbc.org.br/index.php/isys/article/view/361 |
Summary: | Esse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente. |
id |
SBC-5_510f7e11789d45c4d0b77f3d6a0d016e |
---|---|
oai_identifier_str |
oai:journals-sol.sbc.org.br:article/361 |
network_acronym_str |
SBC-5 |
network_name_str |
Brazilian Journal of Information Systems |
repository_id_str |
|
spelling |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve BayesAutomatic Classification of NCM Codes Using the Naïve Bayes AlgorithmMachine LearningConsumer Product ClassificationNCMText classificationNaïve Bayes AlgorithmAprendizado supervisionadoClassificação de TextoAlgoritmo Naïve BayesEsse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente.This paper consists of the development of a classifier for the automatic categorization of product item descriptions into their appropriate Common Mercosul Nomenclature (NCM) codes. This classifier was developed using the Naïve Bayes supervised learning algorithm. For training, data from items of consumer invoices belonging to chapters 22 and 90 of the NCM were used. The results evidenced the capacity of the model to correctly classify the instances. For the simpler and easier data set, based on chapter 22, an accuracy of 98% was obtained, while for the medium and difficult sets, based on chapters 22 and 90, the accuracy obtained was 90% and 83%, respectively.Sociedade Brasileira de Computação2018-06-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://journals-sol.sbc.org.br/index.php/isys/article/view/36110.5753/isys.2018.361iSys - Revista Brasileira de Sistemas de Informação; v. 11 n. 2 (2018); 4-29iSys - Brazilian Journal of Information Systems; Vol. 11 No. 2 (2018); 4-291984-290210.5753/isys.2018.2reponame:Brazilian Journal of Information Systemsinstname:Sociedade Brasileira de Computação (SBC)instacron:SBCporhttps://journals-sol.sbc.org.br/index.php/isys/article/view/361/374Batista, Rodrigo de AbreuBagatini, Daniela D. S.Frozza, Rejaneinfo:eu-repo/semantics/openAccess2020-07-06T19:34:54Zoai:journals-sol.sbc.org.br:article/361Revistahttps://journals-sol.sbc.org.br/index.php/isys/ONGhttps://journals-sol.sbc.org.br/index.php/isys/oaipublicacoes@sbc.org.br1984-29021984-2902opendoar:2020-07-06T19:34:54Brazilian Journal of Information Systems - Sociedade Brasileira de Computação (SBC)false |
dc.title.none.fl_str_mv |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes Automatic Classification of NCM Codes Using the Naïve Bayes Algorithm |
title |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes |
spellingShingle |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes Batista, Rodrigo de Abreu Machine Learning Consumer Product Classification NCM Text classification Naïve Bayes Algorithm Aprendizado supervisionado Classificação de Texto Algoritmo Naïve Bayes |
title_short |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes |
title_full |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes |
title_fullStr |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes |
title_full_unstemmed |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes |
title_sort |
Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes |
author |
Batista, Rodrigo de Abreu |
author_facet |
Batista, Rodrigo de Abreu Bagatini, Daniela D. S. Frozza, Rejane |
author_role |
author |
author2 |
Bagatini, Daniela D. S. Frozza, Rejane |
author2_role |
author author |
dc.contributor.author.fl_str_mv |
Batista, Rodrigo de Abreu Bagatini, Daniela D. S. Frozza, Rejane |
dc.subject.por.fl_str_mv |
Machine Learning Consumer Product Classification NCM Text classification Naïve Bayes Algorithm Aprendizado supervisionado Classificação de Texto Algoritmo Naïve Bayes |
topic |
Machine Learning Consumer Product Classification NCM Text classification Naïve Bayes Algorithm Aprendizado supervisionado Classificação de Texto Algoritmo Naïve Bayes |
description |
Esse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente. |
publishDate |
2018 |
dc.date.none.fl_str_mv |
2018-06-30 |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/article info:eu-repo/semantics/publishedVersion |
format |
article |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://journals-sol.sbc.org.br/index.php/isys/article/view/361 10.5753/isys.2018.361 |
url |
https://journals-sol.sbc.org.br/index.php/isys/article/view/361 |
identifier_str_mv |
10.5753/isys.2018.361 |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
https://journals-sol.sbc.org.br/index.php/isys/article/view/361/374 |
dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.publisher.none.fl_str_mv |
Sociedade Brasileira de Computação |
publisher.none.fl_str_mv |
Sociedade Brasileira de Computação |
dc.source.none.fl_str_mv |
iSys - Revista Brasileira de Sistemas de Informação; v. 11 n. 2 (2018); 4-29 iSys - Brazilian Journal of Information Systems; Vol. 11 No. 2 (2018); 4-29 1984-2902 10.5753/isys.2018.2 reponame:Brazilian Journal of Information Systems instname:Sociedade Brasileira de Computação (SBC) instacron:SBC |
instname_str |
Sociedade Brasileira de Computação (SBC) |
instacron_str |
SBC |
institution |
SBC |
reponame_str |
Brazilian Journal of Information Systems |
collection |
Brazilian Journal of Information Systems |
repository.name.fl_str_mv |
Brazilian Journal of Information Systems - Sociedade Brasileira de Computação (SBC) |
repository.mail.fl_str_mv |
publicacoes@sbc.org.br |
_version_ |
1832110916688150528 |