DF-EXTRACTOR - um modelo para extração e estruturação de documentos financeiros visualmente ricos

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: Alves, Elioenai Lincon Guedes
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://biblioteca.sophia.com.br/terminalri/9575/acervo/detalhe/586762
Resumo: A extração e estruturação de informações presentes em documentos visualmente ricos é um domínio em constante evolução e se destaca pela sua relevância na era digital. À medida que a quantidade de informações digitais cresce exponencialmente, a necessidade de extrair e organizar dados de documentos que incorporam elementos visuais complexos torna-se cada vez mais importante. Os documentos atuais vão além do texto simples, por incorporarem gráficos, imagens, tabelas, diagramas e outras formas de representações visuais que enriquecem a apresentação da informação. Além disso, em muitos documentos, a exemplo dos demonstrativos financeiros, a parte textual possui camadas hierárquicas representadas por seus títulos e subtítulos. Assim, a tarefa de extrair e estruturar dados a partir desses documentos é desafiadora, exigindo o desenvolvimento de algoritmos e técnicas avançadas para interpretar e entender as informações visuais de forma eficaz. Esse processo é fundamental para a análise, organização e utilização eficiente desses dados em diversas áreas, como financeira, pesquisa acadêmica, negócios, medicina, ciência, direito, entre outras. Neste trabalho, exploraremos os avanços e desafios presentes na extração e estruturação de documentos financeiros visualmente ricos. Apresentaremos um sistema de Extração de Informação que utiliza um modelo neural, refinado para uso em Demonstrações Financeiras. Além disso, duas etapas de pós-processamento foram desenvolvidas com o intuito de ajustar os resultados gerados pelo modelo refinado. A partir de avaliações empíricas comparativas, concluiu-se que o sistema proposto é eficaz na extração e estruturação de informações de documentos financeiros e oferece potencial para automatizar e otimizar os processos de análise e validação de demonstrações financeiras. Palavras-chave: Extração de informações, Estruturação de informações, Documentos Visualmente Ricos, Classificação de Texto.