Detalhes bibliográficos
Ano de defesa: |
2010 |
Autor(a) principal: |
Soares, Afranio Martins |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Universidade Estadual do Ceará
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://siduece.uece.br/siduece/trabalhoAcademicoPublico.jsf?id=67306
|
Resumo: |
O crescente armazenamento de informações em meio informatizado, decorrentes das ações e relações humanas, já não é novidade. Porem, a cada dia novos estudos são direcionados à descoberta do conhecimento existente nestas informações. Nesta seara, a extração do conhecimento em bases de dados textuais tem se mostrado um tema de grande relevância, e, para este fim, destaca-se de maneira especial o processo de "Mineração de Texto". A presente dissertação se contextualiza nas atividades de auditorias, desenvolvidas pelos técnicos do Tribunal de Contas dos Municípios do Estado do Ceará-TCMCE. O objetivo fim deste trabalho científico é definir os passos de um processo de mineração de texto, destinado a classificar despesas públicas por objeto de gasto, com base na análise automatizada dos campos de históricos de notas de empenhos, presentes nas prestações de contas dos municípios do Estado do Ceará. A fundamentação teórica aborda, inicialmente, aspectos legais que incidem sobre classificações de despesas na contabilidade pública nacional. Nas seções seguintes são contemplados temas relacionados ao processo de Mineração de Texto, tais como: Mineração de Dados, Processamento de Linguagem Natural, Etapas do processo de Mineração de Textos, Métodos de Avaliação e Modelo de Projetos para Mineração de Dados. A solução desenvolvida para a classificação de documentos de despesas seguiu os passos de um projeto de mineração de texto. Utilizando o modelo de projetos CRISP-DM, foram definidas as etapas de um processo de mineração de textos, objetivando classificar documentos de despesas públicas, através da análise do conteúdo textual dos históricos de notas de empenhos. Dentro dos temas descritos, vale destacar "o Entendimento e Preparação dos Dados e a Construção de Modelos de Classificadores", contemplando, ainda, uma avaliação dos resultados obtidos. As ferramentas utilizadas no processo foram o SGBD Postgresql e o programa WEKA. Demonstra-se, contudo, que a aplicação de técnicas de mineração de texto é uma solução possível e viável, para a extração de conhecimentos e classificação de documentos de despesas públicas. Palavras-chave: Auditorias. Mineração. Texto. Classificação. |