Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural

Bibliographic Details
Main Author: Peres, Luciano Nurnberg
Publication Date: 2024
Format: Doctoral thesis
Language: por
Source: Biblioteca Digital de Teses e Dissertações da USP
Download full: https://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/
Summary: Este trabalho tem o objetivo de verificar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) para auxiliar na avaliação da compreensibilidade da parte textual de relatórios financeiros do setor público. Tal objetivo tem relação com o apontamento de Loughran e Mcdonald (2016), sobre a possibilidade de relacionar a qualidade das informações com o exame de textos de forma computacional e com a visão de Lewis e Young (2019), na qual as técnicas de PLN conciliadas com as análises humanas podem contribuir para a produção de relatórios financeiros com maior qualidade. Entre os objetivos específicos, buscou-se avaliar comparativamente a compreensibilidade da parte textual das naturezas de informação orçamentária e patrimonial de relatórios financeiros do setor público, chamados de Balanços Gerais. Diante da problemática de gerar informações compreensíveis aos usuários das informações financeiras, este trabalho utiliza o modelo transacional da estrutura teórica da comunicação contábil externa proposta por Merkl-Davies e Brennan (2017) para entender como as relações entre emissor, mensagem e receptor dos relatórios financeiros afetam o nível de compreensibilidade. O estudo tem suporte teórico no modelo triádico da Teoria da Semiótica de acordo com a corrente americana de Charles Sanders Peirce, a qual é utilizada para abordar o processo de formação de significado em textos, o que afeta a coesão textual. A compreensibilidade textual é uma característica que depende do texto e dos conhecimentos do leitor, podendo ser abordada sob os conceitos de coesão, a qual é uma característica do texto e de coerência, que é uma característica da representação mental do leitor acerca do conteúdo do texto (Graesser et al., 2004). Para atingir o objetivo proposto, utilizou-se de técnicas de Processamento de Linguagem Natural (PLN) para avaliar a coesão textual, a parte da compreensibilidade que está relacionada diretamente ao texto. Os Balanços Gerais da União dos anos de 2013 a 2022 e os Balanços Gerais estaduais dos anos de 2018 a 2022 foram processados através de técnicas de PLN. Neste processamento, utilizou-se o modelo NILC-Metrix (Leal et al., 2023), o qual calcula 200 métricas que são segregadas em 14 dimensões avaliativas da coesão e complexidade textual da língua portuguesa brasileira. Para possibilitar a avaliação dos resultados proporcionados pelas métricas do modelo NILC-Metrix foram construídos dois córpus de níveis fácil e difícil a partir de informações financeiras do setor público. A construção dos córpus permitiu verificar que as informações financeiras possuem uma linguagem técnica e de menor nível de coesão quando é destinada aos profissionais com conhecimentos contábeis acerca da área pública. Por outro lado, quando o público-alvo das informações é o cidadão, as informações apresentam um maior nível de coesão textual. Em relação à comparação das naturezas de informação, os resultados apontam que as informações patrimoniais apresentam um nível menor de coesão textual, caracterizando-as como informações menos compreensíveis do que as informações orçamentárias.
id USP_1a11b89bccdd23a40d22a59ce3b6c9fb
oai_identifier_str oai:teses.usp.br:tde-29112024-181647
network_acronym_str USP
network_name_str Biblioteca Digital de Teses e Dissertações da USP
repository_id_str 2721
spelling Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem naturalUnderstandability of public sector financial reports: an assessment based on natural language processingCaracterísticas qualitativas da informação contábilCoesãoCohesionCompreensibilidadeNatural language processingProcessamento de linguagem naturalQualitative characteristics of accounting informationUnderstandabilityEste trabalho tem o objetivo de verificar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) para auxiliar na avaliação da compreensibilidade da parte textual de relatórios financeiros do setor público. Tal objetivo tem relação com o apontamento de Loughran e Mcdonald (2016), sobre a possibilidade de relacionar a qualidade das informações com o exame de textos de forma computacional e com a visão de Lewis e Young (2019), na qual as técnicas de PLN conciliadas com as análises humanas podem contribuir para a produção de relatórios financeiros com maior qualidade. Entre os objetivos específicos, buscou-se avaliar comparativamente a compreensibilidade da parte textual das naturezas de informação orçamentária e patrimonial de relatórios financeiros do setor público, chamados de Balanços Gerais. Diante da problemática de gerar informações compreensíveis aos usuários das informações financeiras, este trabalho utiliza o modelo transacional da estrutura teórica da comunicação contábil externa proposta por Merkl-Davies e Brennan (2017) para entender como as relações entre emissor, mensagem e receptor dos relatórios financeiros afetam o nível de compreensibilidade. O estudo tem suporte teórico no modelo triádico da Teoria da Semiótica de acordo com a corrente americana de Charles Sanders Peirce, a qual é utilizada para abordar o processo de formação de significado em textos, o que afeta a coesão textual. A compreensibilidade textual é uma característica que depende do texto e dos conhecimentos do leitor, podendo ser abordada sob os conceitos de coesão, a qual é uma característica do texto e de coerência, que é uma característica da representação mental do leitor acerca do conteúdo do texto (Graesser et al., 2004). Para atingir o objetivo proposto, utilizou-se de técnicas de Processamento de Linguagem Natural (PLN) para avaliar a coesão textual, a parte da compreensibilidade que está relacionada diretamente ao texto. Os Balanços Gerais da União dos anos de 2013 a 2022 e os Balanços Gerais estaduais dos anos de 2018 a 2022 foram processados através de técnicas de PLN. Neste processamento, utilizou-se o modelo NILC-Metrix (Leal et al., 2023), o qual calcula 200 métricas que são segregadas em 14 dimensões avaliativas da coesão e complexidade textual da língua portuguesa brasileira. Para possibilitar a avaliação dos resultados proporcionados pelas métricas do modelo NILC-Metrix foram construídos dois córpus de níveis fácil e difícil a partir de informações financeiras do setor público. A construção dos córpus permitiu verificar que as informações financeiras possuem uma linguagem técnica e de menor nível de coesão quando é destinada aos profissionais com conhecimentos contábeis acerca da área pública. Por outro lado, quando o público-alvo das informações é o cidadão, as informações apresentam um maior nível de coesão textual. Em relação à comparação das naturezas de informação, os resultados apontam que as informações patrimoniais apresentam um nível menor de coesão textual, caracterizando-as como informações menos compreensíveis do que as informações orçamentárias.This work aims to verify the possibility of using Natural Language Processing (NLP) techniques to assist in the evaluation of the understandability of the textual part of public sector financial reports. This objective is related to the view of Loughran and Mcdonald (2016), about the possibility of relating the quality of information with the examination of texts in a computational way and with the vision of Lewis and Young (2019), in which NLP techniques combined with human analysis can contribute to the production of higher quality financial reports. Among the specific objectives, there is the comparative evaluation of the understandability of the textual part of the budgetary and financial information natures of public sector financial reports, called General Balances. To face the problem of generating comprehensible information for users of financial information, this work uses the transactional model of the theoretical structure of external accounting communication proposed by Merkl-Davies and Brennan (2017) to understand how the relationships between sender, message and receiver of financial reports affect the level of understandability. The study has theoretical support in the triadic model of Semiotics Theory according to the american theoretical stream of Charles Sanders Peirce, which is used to address the process of meaning formation in texts, which affects textual cohesion. Textual understandability is a characteristic that depends on the text and the reader\'s knowledge, and can be approached under the concepts of cohesion, which is a characteristic of the text, and coherence, which is a characteristic of the reader\'s mental representation of the text\'s content (Graesser et al., 2004). To achieve the proposed objective, Natural Language Processing (NLP) techniques were used to evaluate textual cohesion, the part of comprehensibility that is directly related to the text. The General Balance of Union (Balanço Geral da União) for the years 2013 to 2022 and the General Balance of states (Balanços Gerais dos estados) for the years 2018 to 2022 were processed using NLP techniques. In this processing, the NILC-Metrix model (Leal et al., 2023) was used, which calculates 200 metrics that are segregated into 14 dimensions evaluating the cohesion and textual complexity of the Brazilian Portuguese language. To enable the evaluation of the results provided by the NILC-Metrix model metrics, two corpora of easy and difficult levels were constructed based on financial information from the public sector. The construction of the corpus made it possible to verify that financial information has a technical language and a lower level of cohesion when it is intended for professionals with accounting knowledge about the public area. On the other hand, when the target audience for information is citizens, the information presents a higher level of textual cohesion. Regarding the comparison of the nature of information, the results indicate that financial information presents a lower level of textual cohesion, characterizing it as less comprehensible information than budgetary information.Biblioteca Digitais de Teses e Dissertações da USPVarela, Patrícia SiqueiraPeres, Luciano Nurnberg2024-07-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-12-05T18:16:02Zoai:teses.usp.br:tde-29112024-181647Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-12-05T18:16:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false
dc.title.none.fl_str_mv Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
Understandability of public sector financial reports: an assessment based on natural language processing
title Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
spellingShingle Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
Peres, Luciano Nurnberg
Características qualitativas da informação contábil
Coesão
Cohesion
Compreensibilidade
Natural language processing
Processamento de linguagem natural
Qualitative characteristics of accounting information
Understandability
title_short Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
title_full Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
title_fullStr Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
title_full_unstemmed Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
title_sort Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
author Peres, Luciano Nurnberg
author_facet Peres, Luciano Nurnberg
author_role author
dc.contributor.none.fl_str_mv Varela, Patrícia Siqueira
dc.contributor.author.fl_str_mv Peres, Luciano Nurnberg
dc.subject.por.fl_str_mv Características qualitativas da informação contábil
Coesão
Cohesion
Compreensibilidade
Natural language processing
Processamento de linguagem natural
Qualitative characteristics of accounting information
Understandability
topic Características qualitativas da informação contábil
Coesão
Cohesion
Compreensibilidade
Natural language processing
Processamento de linguagem natural
Qualitative characteristics of accounting information
Understandability
description Este trabalho tem o objetivo de verificar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) para auxiliar na avaliação da compreensibilidade da parte textual de relatórios financeiros do setor público. Tal objetivo tem relação com o apontamento de Loughran e Mcdonald (2016), sobre a possibilidade de relacionar a qualidade das informações com o exame de textos de forma computacional e com a visão de Lewis e Young (2019), na qual as técnicas de PLN conciliadas com as análises humanas podem contribuir para a produção de relatórios financeiros com maior qualidade. Entre os objetivos específicos, buscou-se avaliar comparativamente a compreensibilidade da parte textual das naturezas de informação orçamentária e patrimonial de relatórios financeiros do setor público, chamados de Balanços Gerais. Diante da problemática de gerar informações compreensíveis aos usuários das informações financeiras, este trabalho utiliza o modelo transacional da estrutura teórica da comunicação contábil externa proposta por Merkl-Davies e Brennan (2017) para entender como as relações entre emissor, mensagem e receptor dos relatórios financeiros afetam o nível de compreensibilidade. O estudo tem suporte teórico no modelo triádico da Teoria da Semiótica de acordo com a corrente americana de Charles Sanders Peirce, a qual é utilizada para abordar o processo de formação de significado em textos, o que afeta a coesão textual. A compreensibilidade textual é uma característica que depende do texto e dos conhecimentos do leitor, podendo ser abordada sob os conceitos de coesão, a qual é uma característica do texto e de coerência, que é uma característica da representação mental do leitor acerca do conteúdo do texto (Graesser et al., 2004). Para atingir o objetivo proposto, utilizou-se de técnicas de Processamento de Linguagem Natural (PLN) para avaliar a coesão textual, a parte da compreensibilidade que está relacionada diretamente ao texto. Os Balanços Gerais da União dos anos de 2013 a 2022 e os Balanços Gerais estaduais dos anos de 2018 a 2022 foram processados através de técnicas de PLN. Neste processamento, utilizou-se o modelo NILC-Metrix (Leal et al., 2023), o qual calcula 200 métricas que são segregadas em 14 dimensões avaliativas da coesão e complexidade textual da língua portuguesa brasileira. Para possibilitar a avaliação dos resultados proporcionados pelas métricas do modelo NILC-Metrix foram construídos dois córpus de níveis fácil e difícil a partir de informações financeiras do setor público. A construção dos córpus permitiu verificar que as informações financeiras possuem uma linguagem técnica e de menor nível de coesão quando é destinada aos profissionais com conhecimentos contábeis acerca da área pública. Por outro lado, quando o público-alvo das informações é o cidadão, as informações apresentam um maior nível de coesão textual. Em relação à comparação das naturezas de informação, os resultados apontam que as informações patrimoniais apresentam um nível menor de coesão textual, caracterizando-as como informações menos compreensíveis do que as informações orçamentárias.
publishDate 2024
dc.date.none.fl_str_mv 2024-07-16
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/doctoralThesis
format doctoralThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv https://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/
url https://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/
dc.language.iso.fl_str_mv por
language por
dc.relation.none.fl_str_mv
dc.rights.driver.fl_str_mv Liberar o conteúdo para acesso público.
info:eu-repo/semantics/openAccess
rights_invalid_str_mv Liberar o conteúdo para acesso público.
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.coverage.none.fl_str_mv
dc.publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
publisher.none.fl_str_mv Biblioteca Digitais de Teses e Dissertações da USP
dc.source.none.fl_str_mv
reponame:Biblioteca Digital de Teses e Dissertações da USP
instname:Universidade de São Paulo (USP)
instacron:USP
instname_str Universidade de São Paulo (USP)
instacron_str USP
institution USP
reponame_str Biblioteca Digital de Teses e Dissertações da USP
collection Biblioteca Digital de Teses e Dissertações da USP
repository.name.fl_str_mv Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)
repository.mail.fl_str_mv virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br
_version_ 1826319293283827712