A mineração de texto na análise de contas públicas municipais

Detalhes bibliográficos
Ano de defesa: 2010
Autor(a) principal: Soares, Afranio Martins
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Estadual do Ceará
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67306
Resumo: O crescente armazenamento de informações em meio informatizado, decorrentes das ações e relações humanas, já não é novidade. Porem, a cada dia novos estudos são direcionados à descoberta do conhecimento existente nestas informações. Nesta seara, a extração do conhecimento em bases de dados textuais tem se mostrado um tema de grande relevância, e, para este fim, destaca-se de maneira especial o processo de "Mineração de Texto". A presente dissertação se contextualiza nas atividades de auditorias, desenvolvidas pelos técnicos do Tribunal de Contas dos Municípios do Estado do Ceará-TCMCE. O objetivo fim deste trabalho científico é definir os passos de um processo de mineração de texto, destinado a classificar despesas públicas por objeto de gasto, com base na análise automatizada dos campos de históricos de notas de empenhos, presentes nas prestações de contas dos municípios do Estado do Ceará. A fundamentação teórica aborda, inicialmente, aspectos legais que incidem sobre classificações de despesas na contabilidade pública nacional. Nas seções seguintes são contemplados temas relacionados ao processo de Mineração de Texto, tais como: Mineração de Dados, Processamento de Linguagem Natural, Etapas do processo de Mineração de Textos, Métodos de Avaliação e Modelo de Projetos para Mineração de Dados. A solução desenvolvida para a classificação de documentos de despesas seguiu os passos de um projeto de mineração de texto. Utilizando o modelo de projetos CRISP-DM, foram definidas as etapas de um processo de mineração de textos, objetivando classificar documentos de despesas públicas, através da análise do conteúdo textual dos históricos de notas de empenhos. Dentro dos temas descritos, vale destacar "o Entendimento e Preparação dos Dados e a Construção de Modelos de Classificadores", contemplando, ainda, uma avaliação dos resultados obtidos. As ferramentas utilizadas no processo foram o SGBD Postgresql e o programa WEKA. Demonstra-se, contudo, que a aplicação de técnicas de mineração de texto é uma solução possível e viável, para a extração de conhecimentos e classificação de documentos de despesas públicas. Palavras-chave: Auditorias. Mineração. Texto. Classificação.