Um processo de mineração de dados aplicados ao combate à sonegação fiscal do ICMS

Detalhes bibliográficos
Ano de defesa: 2009
Autor(a) principal: Andrade, Helder da Silva
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Ceará
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=57863
Resumo: <span style="font-style: normal;">O objetivo deste trabalho é propor um processo de mineração de dados aplicado ao problema da sonegação do ICMS - Imposto sobre operações relativas à Circulação de Mercadorias e sobre prestações de Serviços de transporte interestadual e intermunicipal e de comunicação. O processo proposto consiste em uma extensão do CRISP-DM (CRoss Industry Standard Process for Data Mining) através da utilização de algoritmos de Redes Neurais Artificiais - RNA's. A proposta divide a fase de Modelagem do CRISP-DM em três subfases bem determinadas: Clusterização, Seleção de Atributos e Classificação. Dois dos modelos clássicos de RNAs foram utilizados dentro do processo proposto. Uma RNA do tipo mapa auto-organizável com algoritmo de Kohonen foi utilizada na fase de </span><em>Clusterização</em> para agrupamento dos dados aproveitando as suas próprias características. Outra RNA do tipo Perceptron Multicamadas (MLP) com algoritmo de retro propagação de erros foi utilizada na fase de Classificação. Entre essas fases, uma outra foi inserida para Seleção de Atributos, a qual utiliza o algoritmo C5.0, objetivando descartar dados não significativos para a classificação, otimizar o tempo de treinamento e dar mais qualidade ao processo. Para validar o processo foi utilizada uma base de dados típica de uma administração tributária estadual e, ao final, para validá-lo, os resultados foram avaliados e comparados com resultados de outros modelos. Palavras chaves: Mineração de Dados, CRISP-DM, Redes Neurais Artificiais, Sonegação, ICMS.