Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes

Bibliographic Details
Main Author: Batista, Rodrigo de Abreu
Publication Date: 2018
Other Authors: Bagatini, Daniela D. S., Frozza, Rejane
Format: Article
Language: por
Source: Brazilian Journal of Information Systems
Download full: https://journals-sol.sbc.org.br/index.php/isys/article/view/361
Summary: Esse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente.
id SBC-5_510f7e11789d45c4d0b77f3d6a0d016e
oai_identifier_str oai:journals-sol.sbc.org.br:article/361
network_acronym_str SBC-5
network_name_str Brazilian Journal of Information Systems
repository_id_str
spelling Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve BayesAutomatic Classification of NCM Codes Using the Naïve Bayes AlgorithmMachine LearningConsumer Product ClassificationNCMText classificationNaïve Bayes AlgorithmAprendizado supervisionadoClassificação de TextoAlgoritmo Naïve BayesEsse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente.This paper consists of the development of a classifier for the automatic categorization of product item descriptions into their appropriate Common Mercosul Nomenclature (NCM) codes. This classifier was developed using the Naïve Bayes supervised learning algorithm. For training, data from items of consumer invoices belonging to chapters 22 and 90 of the NCM were used. The results evidenced the capacity of the model to correctly classify the instances. For the simpler and easier data set, based on chapter 22, an accuracy of 98% was obtained, while for the medium and difficult sets, based on chapters 22 and 90, the accuracy obtained was 90% and 83%, respectively.Sociedade Brasileira de Computação2018-06-30info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionapplication/pdfhttps://journals-sol.sbc.org.br/index.php/isys/article/view/36110.5753/isys.2018.361iSys - Revista Brasileira de Sistemas de Informação; v. 11 n. 2 (2018); 4-29iSys - Brazilian Journal of Information Systems; Vol. 11 No. 2 (2018); 4-291984-290210.5753/isys.2018.2reponame:Brazilian Journal of Information Systemsinstname:Sociedade Brasileira de Computação (SBC)instacron:SBCporhttps://journals-sol.sbc.org.br/index.php/isys/article/view/361/374Batista, Rodrigo de AbreuBagatini, Daniela D. S.Frozza, Rejaneinfo:eu-repo/semantics/openAccess2020-07-06T19:34:54Zoai:journals-sol.sbc.org.br:article/361Revistahttps://journals-sol.sbc.org.br/index.php/isys/ONGhttps://journals-sol.sbc.org.br/index.php/isys/oaipublicacoes@sbc.org.br1984-29021984-2902opendoar:2020-07-06T19:34:54Brazilian Journal of Information Systems - Sociedade Brasileira de Computação (SBC)false
dc.title.none.fl_str_mv Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
Automatic Classification of NCM Codes Using the Naïve Bayes Algorithm
title Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
spellingShingle Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
Batista, Rodrigo de Abreu
Machine Learning
Consumer Product Classification
NCM
Text classification
Naïve Bayes Algorithm
Aprendizado supervisionado
Classificação de Texto
Algoritmo Naïve Bayes
title_short Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
title_full Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
title_fullStr Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
title_full_unstemmed Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
title_sort Classificação Automática de Códigos NCM Utilizando o Algoritmo Naïve Bayes
author Batista, Rodrigo de Abreu
author_facet Batista, Rodrigo de Abreu
Bagatini, Daniela D. S.
Frozza, Rejane
author_role author
author2 Bagatini, Daniela D. S.
Frozza, Rejane
author2_role author
author
dc.contributor.author.fl_str_mv Batista, Rodrigo de Abreu
Bagatini, Daniela D. S.
Frozza, Rejane
dc.subject.por.fl_str_mv Machine Learning
Consumer Product Classification
NCM
Text classification
Naïve Bayes Algorithm
Aprendizado supervisionado
Classificação de Texto
Algoritmo Naïve Bayes
topic Machine Learning
Consumer Product Classification
NCM
Text classification
Naïve Bayes Algorithm
Aprendizado supervisionado
Classificação de Texto
Algoritmo Naïve Bayes
description Esse artigo consiste no estudo e desenvolvimento de um classificador de texto para a categorização automática de descrições de itens de produto em seus códigos da Nomenclatura Comum do Mercosul (NCM). O desenvolvimento desse classificador foi realizado utilizando aprendizado supervisionado em combinação com o algoritmo Naïve Bayes. Para treinamento do classificador foram utilizados dados de itens de notas fiscais ao consumidor pertencentes aos capítulos 22 e 90 do NCM. Os resultados evidenciaram, com o auxílio da abordagem de validação cruzada com 10-folds, a capacidade do modelo em classificar corretamente as instâncias. Para o conjunto de dados mais simples e considerado fácil, obteve-se uma acurácia de 98%, enquanto para os conjuntos médio e difícil, as acurácias obtidas foram de 90% e 83%, respectivamente.
publishDate 2018
dc.date.none.fl_str_mv 2018-06-30
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion
format article
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://journals-sol.sbc.org.br/index.php/isys/article/view/361
10.5753/isys.2018.361
url https://journals-sol.sbc.org.br/index.php/isys/article/view/361
identifier_str_mv 10.5753/isys.2018.361
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv https://journals-sol.sbc.org.br/index.php/isys/article/view/361/374
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.publisher.none.fl_str_mv Sociedade Brasileira de Computação
publisher.none.fl_str_mv Sociedade Brasileira de Computação
dc.source.none.fl_str_mv iSys - Revista Brasileira de Sistemas de Informação; v. 11 n. 2 (2018); 4-29
iSys - Brazilian Journal of Information Systems; Vol. 11 No. 2 (2018); 4-29
1984-2902
10.5753/isys.2018.2
reponame:Brazilian Journal of Information Systems
instname:Sociedade Brasileira de Computação (SBC)
instacron:SBC
instname_str Sociedade Brasileira de Computação (SBC)
instacron_str SBC
institution SBC
reponame_str Brazilian Journal of Information Systems
collection Brazilian Journal of Information Systems
repository.name.fl_str_mv Brazilian Journal of Information Systems - Sociedade Brasileira de Computação (SBC)
repository.mail.fl_str_mv publicacoes@sbc.org.br
_version_ 1832110916688150528