Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural
Main Author: | |
---|---|
Publication Date: | 2024 |
Format: | Doctoral thesis |
Language: | por |
Source: | Biblioteca Digital de Teses e Dissertações da USP |
Download full: | https://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/ |
Summary: | Este trabalho tem o objetivo de verificar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) para auxiliar na avaliação da compreensibilidade da parte textual de relatórios financeiros do setor público. Tal objetivo tem relação com o apontamento de Loughran e Mcdonald (2016), sobre a possibilidade de relacionar a qualidade das informações com o exame de textos de forma computacional e com a visão de Lewis e Young (2019), na qual as técnicas de PLN conciliadas com as análises humanas podem contribuir para a produção de relatórios financeiros com maior qualidade. Entre os objetivos específicos, buscou-se avaliar comparativamente a compreensibilidade da parte textual das naturezas de informação orçamentária e patrimonial de relatórios financeiros do setor público, chamados de Balanços Gerais. Diante da problemática de gerar informações compreensíveis aos usuários das informações financeiras, este trabalho utiliza o modelo transacional da estrutura teórica da comunicação contábil externa proposta por Merkl-Davies e Brennan (2017) para entender como as relações entre emissor, mensagem e receptor dos relatórios financeiros afetam o nível de compreensibilidade. O estudo tem suporte teórico no modelo triádico da Teoria da Semiótica de acordo com a corrente americana de Charles Sanders Peirce, a qual é utilizada para abordar o processo de formação de significado em textos, o que afeta a coesão textual. A compreensibilidade textual é uma característica que depende do texto e dos conhecimentos do leitor, podendo ser abordada sob os conceitos de coesão, a qual é uma característica do texto e de coerência, que é uma característica da representação mental do leitor acerca do conteúdo do texto (Graesser et al., 2004). Para atingir o objetivo proposto, utilizou-se de técnicas de Processamento de Linguagem Natural (PLN) para avaliar a coesão textual, a parte da compreensibilidade que está relacionada diretamente ao texto. Os Balanços Gerais da União dos anos de 2013 a 2022 e os Balanços Gerais estaduais dos anos de 2018 a 2022 foram processados através de técnicas de PLN. Neste processamento, utilizou-se o modelo NILC-Metrix (Leal et al., 2023), o qual calcula 200 métricas que são segregadas em 14 dimensões avaliativas da coesão e complexidade textual da língua portuguesa brasileira. Para possibilitar a avaliação dos resultados proporcionados pelas métricas do modelo NILC-Metrix foram construídos dois córpus de níveis fácil e difícil a partir de informações financeiras do setor público. A construção dos córpus permitiu verificar que as informações financeiras possuem uma linguagem técnica e de menor nível de coesão quando é destinada aos profissionais com conhecimentos contábeis acerca da área pública. Por outro lado, quando o público-alvo das informações é o cidadão, as informações apresentam um maior nível de coesão textual. Em relação à comparação das naturezas de informação, os resultados apontam que as informações patrimoniais apresentam um nível menor de coesão textual, caracterizando-as como informações menos compreensíveis do que as informações orçamentárias. |
id |
USP_1a11b89bccdd23a40d22a59ce3b6c9fb |
---|---|
oai_identifier_str |
oai:teses.usp.br:tde-29112024-181647 |
network_acronym_str |
USP |
network_name_str |
Biblioteca Digital de Teses e Dissertações da USP |
repository_id_str |
2721 |
spelling |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem naturalUnderstandability of public sector financial reports: an assessment based on natural language processingCaracterísticas qualitativas da informação contábilCoesãoCohesionCompreensibilidadeNatural language processingProcessamento de linguagem naturalQualitative characteristics of accounting informationUnderstandabilityEste trabalho tem o objetivo de verificar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) para auxiliar na avaliação da compreensibilidade da parte textual de relatórios financeiros do setor público. Tal objetivo tem relação com o apontamento de Loughran e Mcdonald (2016), sobre a possibilidade de relacionar a qualidade das informações com o exame de textos de forma computacional e com a visão de Lewis e Young (2019), na qual as técnicas de PLN conciliadas com as análises humanas podem contribuir para a produção de relatórios financeiros com maior qualidade. Entre os objetivos específicos, buscou-se avaliar comparativamente a compreensibilidade da parte textual das naturezas de informação orçamentária e patrimonial de relatórios financeiros do setor público, chamados de Balanços Gerais. Diante da problemática de gerar informações compreensíveis aos usuários das informações financeiras, este trabalho utiliza o modelo transacional da estrutura teórica da comunicação contábil externa proposta por Merkl-Davies e Brennan (2017) para entender como as relações entre emissor, mensagem e receptor dos relatórios financeiros afetam o nível de compreensibilidade. O estudo tem suporte teórico no modelo triádico da Teoria da Semiótica de acordo com a corrente americana de Charles Sanders Peirce, a qual é utilizada para abordar o processo de formação de significado em textos, o que afeta a coesão textual. A compreensibilidade textual é uma característica que depende do texto e dos conhecimentos do leitor, podendo ser abordada sob os conceitos de coesão, a qual é uma característica do texto e de coerência, que é uma característica da representação mental do leitor acerca do conteúdo do texto (Graesser et al., 2004). Para atingir o objetivo proposto, utilizou-se de técnicas de Processamento de Linguagem Natural (PLN) para avaliar a coesão textual, a parte da compreensibilidade que está relacionada diretamente ao texto. Os Balanços Gerais da União dos anos de 2013 a 2022 e os Balanços Gerais estaduais dos anos de 2018 a 2022 foram processados através de técnicas de PLN. Neste processamento, utilizou-se o modelo NILC-Metrix (Leal et al., 2023), o qual calcula 200 métricas que são segregadas em 14 dimensões avaliativas da coesão e complexidade textual da língua portuguesa brasileira. Para possibilitar a avaliação dos resultados proporcionados pelas métricas do modelo NILC-Metrix foram construídos dois córpus de níveis fácil e difícil a partir de informações financeiras do setor público. A construção dos córpus permitiu verificar que as informações financeiras possuem uma linguagem técnica e de menor nível de coesão quando é destinada aos profissionais com conhecimentos contábeis acerca da área pública. Por outro lado, quando o público-alvo das informações é o cidadão, as informações apresentam um maior nível de coesão textual. Em relação à comparação das naturezas de informação, os resultados apontam que as informações patrimoniais apresentam um nível menor de coesão textual, caracterizando-as como informações menos compreensíveis do que as informações orçamentárias.This work aims to verify the possibility of using Natural Language Processing (NLP) techniques to assist in the evaluation of the understandability of the textual part of public sector financial reports. This objective is related to the view of Loughran and Mcdonald (2016), about the possibility of relating the quality of information with the examination of texts in a computational way and with the vision of Lewis and Young (2019), in which NLP techniques combined with human analysis can contribute to the production of higher quality financial reports. Among the specific objectives, there is the comparative evaluation of the understandability of the textual part of the budgetary and financial information natures of public sector financial reports, called General Balances. To face the problem of generating comprehensible information for users of financial information, this work uses the transactional model of the theoretical structure of external accounting communication proposed by Merkl-Davies and Brennan (2017) to understand how the relationships between sender, message and receiver of financial reports affect the level of understandability. The study has theoretical support in the triadic model of Semiotics Theory according to the american theoretical stream of Charles Sanders Peirce, which is used to address the process of meaning formation in texts, which affects textual cohesion. Textual understandability is a characteristic that depends on the text and the reader\'s knowledge, and can be approached under the concepts of cohesion, which is a characteristic of the text, and coherence, which is a characteristic of the reader\'s mental representation of the text\'s content (Graesser et al., 2004). To achieve the proposed objective, Natural Language Processing (NLP) techniques were used to evaluate textual cohesion, the part of comprehensibility that is directly related to the text. The General Balance of Union (Balanço Geral da União) for the years 2013 to 2022 and the General Balance of states (Balanços Gerais dos estados) for the years 2018 to 2022 were processed using NLP techniques. In this processing, the NILC-Metrix model (Leal et al., 2023) was used, which calculates 200 metrics that are segregated into 14 dimensions evaluating the cohesion and textual complexity of the Brazilian Portuguese language. To enable the evaluation of the results provided by the NILC-Metrix model metrics, two corpora of easy and difficult levels were constructed based on financial information from the public sector. The construction of the corpus made it possible to verify that financial information has a technical language and a lower level of cohesion when it is intended for professionals with accounting knowledge about the public area. On the other hand, when the target audience for information is citizens, the information presents a higher level of textual cohesion. Regarding the comparison of the nature of information, the results indicate that financial information presents a lower level of textual cohesion, characterizing it as less comprehensible information than budgetary information.Biblioteca Digitais de Teses e Dissertações da USPVarela, Patrícia SiqueiraPeres, Luciano Nurnberg2024-07-16info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/doctoralThesisapplication/pdfhttps://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/reponame:Biblioteca Digital de Teses e Dissertações da USPinstname:Universidade de São Paulo (USP)instacron:USPLiberar o conteúdo para acesso público.info:eu-repo/semantics/openAccesspor2024-12-05T18:16:02Zoai:teses.usp.br:tde-29112024-181647Biblioteca Digital de Teses e Dissertaçõeshttp://www.teses.usp.br/PUBhttp://www.teses.usp.br/cgi-bin/mtd2br.plvirginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.bropendoar:27212024-12-05T18:16:02Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP)false |
dc.title.none.fl_str_mv |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural Understandability of public sector financial reports: an assessment based on natural language processing |
title |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural |
spellingShingle |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural Peres, Luciano Nurnberg Características qualitativas da informação contábil Coesão Cohesion Compreensibilidade Natural language processing Processamento de linguagem natural Qualitative characteristics of accounting information Understandability |
title_short |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural |
title_full |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural |
title_fullStr |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural |
title_full_unstemmed |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural |
title_sort |
Compreensibilidade de relatórios financeiros do setor público: uma avaliação baseada em processamento de linguagem natural |
author |
Peres, Luciano Nurnberg |
author_facet |
Peres, Luciano Nurnberg |
author_role |
author |
dc.contributor.none.fl_str_mv |
Varela, Patrícia Siqueira |
dc.contributor.author.fl_str_mv |
Peres, Luciano Nurnberg |
dc.subject.por.fl_str_mv |
Características qualitativas da informação contábil Coesão Cohesion Compreensibilidade Natural language processing Processamento de linguagem natural Qualitative characteristics of accounting information Understandability |
topic |
Características qualitativas da informação contábil Coesão Cohesion Compreensibilidade Natural language processing Processamento de linguagem natural Qualitative characteristics of accounting information Understandability |
description |
Este trabalho tem o objetivo de verificar a possibilidade de utilizar técnicas de Processamento de Linguagem Natural (PLN) para auxiliar na avaliação da compreensibilidade da parte textual de relatórios financeiros do setor público. Tal objetivo tem relação com o apontamento de Loughran e Mcdonald (2016), sobre a possibilidade de relacionar a qualidade das informações com o exame de textos de forma computacional e com a visão de Lewis e Young (2019), na qual as técnicas de PLN conciliadas com as análises humanas podem contribuir para a produção de relatórios financeiros com maior qualidade. Entre os objetivos específicos, buscou-se avaliar comparativamente a compreensibilidade da parte textual das naturezas de informação orçamentária e patrimonial de relatórios financeiros do setor público, chamados de Balanços Gerais. Diante da problemática de gerar informações compreensíveis aos usuários das informações financeiras, este trabalho utiliza o modelo transacional da estrutura teórica da comunicação contábil externa proposta por Merkl-Davies e Brennan (2017) para entender como as relações entre emissor, mensagem e receptor dos relatórios financeiros afetam o nível de compreensibilidade. O estudo tem suporte teórico no modelo triádico da Teoria da Semiótica de acordo com a corrente americana de Charles Sanders Peirce, a qual é utilizada para abordar o processo de formação de significado em textos, o que afeta a coesão textual. A compreensibilidade textual é uma característica que depende do texto e dos conhecimentos do leitor, podendo ser abordada sob os conceitos de coesão, a qual é uma característica do texto e de coerência, que é uma característica da representação mental do leitor acerca do conteúdo do texto (Graesser et al., 2004). Para atingir o objetivo proposto, utilizou-se de técnicas de Processamento de Linguagem Natural (PLN) para avaliar a coesão textual, a parte da compreensibilidade que está relacionada diretamente ao texto. Os Balanços Gerais da União dos anos de 2013 a 2022 e os Balanços Gerais estaduais dos anos de 2018 a 2022 foram processados através de técnicas de PLN. Neste processamento, utilizou-se o modelo NILC-Metrix (Leal et al., 2023), o qual calcula 200 métricas que são segregadas em 14 dimensões avaliativas da coesão e complexidade textual da língua portuguesa brasileira. Para possibilitar a avaliação dos resultados proporcionados pelas métricas do modelo NILC-Metrix foram construídos dois córpus de níveis fácil e difícil a partir de informações financeiras do setor público. A construção dos córpus permitiu verificar que as informações financeiras possuem uma linguagem técnica e de menor nível de coesão quando é destinada aos profissionais com conhecimentos contábeis acerca da área pública. Por outro lado, quando o público-alvo das informações é o cidadão, as informações apresentam um maior nível de coesão textual. Em relação à comparação das naturezas de informação, os resultados apontam que as informações patrimoniais apresentam um nível menor de coesão textual, caracterizando-as como informações menos compreensíveis do que as informações orçamentárias. |
publishDate |
2024 |
dc.date.none.fl_str_mv |
2024-07-16 |
dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
dc.type.driver.fl_str_mv |
info:eu-repo/semantics/doctoralThesis |
format |
doctoralThesis |
status_str |
publishedVersion |
dc.identifier.uri.fl_str_mv |
https://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/ |
url |
https://www.teses.usp.br/teses/disponiveis/12/12136/tde-29112024-181647/ |
dc.language.iso.fl_str_mv |
por |
language |
por |
dc.relation.none.fl_str_mv |
|
dc.rights.driver.fl_str_mv |
Liberar o conteúdo para acesso público. info:eu-repo/semantics/openAccess |
rights_invalid_str_mv |
Liberar o conteúdo para acesso público. |
eu_rights_str_mv |
openAccess |
dc.format.none.fl_str_mv |
application/pdf |
dc.coverage.none.fl_str_mv |
|
dc.publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
publisher.none.fl_str_mv |
Biblioteca Digitais de Teses e Dissertações da USP |
dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da USP instname:Universidade de São Paulo (USP) instacron:USP |
instname_str |
Universidade de São Paulo (USP) |
instacron_str |
USP |
institution |
USP |
reponame_str |
Biblioteca Digital de Teses e Dissertações da USP |
collection |
Biblioteca Digital de Teses e Dissertações da USP |
repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da USP - Universidade de São Paulo (USP) |
repository.mail.fl_str_mv |
virginia@if.usp.br|| atendimento@aguia.usp.br||virginia@if.usp.br |
_version_ |
1826319293283827712 |