Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2023 |
| Tipo de documento: | Trabalho de conclusão de curso |
| Idioma: | por |
| Título da fonte: | Biblioteca Digital de Teses e Dissertações da UFPB |
| Texto Completo: | https://repositorio.ufpb.br/jspui/handle/123456789/27186 |
Resumo: | This article comes from a Scientific Initiation research Project at UFPB, with the objective of creating programming scripts to collect, clean, organize and analyze the textual corpus of the research. The project stems from understanding the importance of changing political discourse as an indicator of the domestic salience of international norms, in this case, the global development agenda expressed by the Sustainable Development Goals (SDGs). Initially, the research started with the effort to build an extensive database, containing all the speeches of the Presidents of the Republic of Brazil since 1985, a milestone of the country's redemocratization. As a conceptual apparatus, salience is understood as the variation in the legitimacy of international norms in a domestic context, measured through institutional, political and discourse or rhetoric changes. Dealing with such a long period, there was a change in the way of storing the collection of the Presidency of the Republic, which resulted in the need to create specific scripts to automate the collection and processing of data in an operational way for future analysis. As a result, this work describes the technologies developed, in the form of scripts in the Python language, for the construction of an extensive textual corpus, with more than six thousand speeches, and adaptable for future collection. In addition to overcoming the lack of standardization and systematization resulting from changes in government and technologies, the result shows a fruitful approximation between International Relations and other social sciences with elements of computing. Initially thought for the specific project, the merit of this research can be used for several other analyses, in an operational way, and easily adapted to modern software. Once the database was operationalized, the pre-reading of the material led to changes in the analysis intentions, which is why analysis scripts were not continued. |
| id |
UFPB_ccadd28e5902ff4245a05d8dc288ab3c |
|---|---|
| oai_identifier_str |
oai:repositorio.ufpb.br:123456789/27186 |
| network_acronym_str |
UFPB |
| network_name_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
| repository_id_str |
|
| spelling |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textualPesquisa qualitativaColeta de dadosTratamento de dadosAnálise de conteúdoDiscurso PolíticoRotinas de programaçãoCNPQ::OUTROS::RELACOES INTERNACIONAISThis article comes from a Scientific Initiation research Project at UFPB, with the objective of creating programming scripts to collect, clean, organize and analyze the textual corpus of the research. The project stems from understanding the importance of changing political discourse as an indicator of the domestic salience of international norms, in this case, the global development agenda expressed by the Sustainable Development Goals (SDGs). Initially, the research started with the effort to build an extensive database, containing all the speeches of the Presidents of the Republic of Brazil since 1985, a milestone of the country's redemocratization. As a conceptual apparatus, salience is understood as the variation in the legitimacy of international norms in a domestic context, measured through institutional, political and discourse or rhetoric changes. Dealing with such a long period, there was a change in the way of storing the collection of the Presidency of the Republic, which resulted in the need to create specific scripts to automate the collection and processing of data in an operational way for future analysis. As a result, this work describes the technologies developed, in the form of scripts in the Python language, for the construction of an extensive textual corpus, with more than six thousand speeches, and adaptable for future collection. In addition to overcoming the lack of standardization and systematization resulting from changes in government and technologies, the result shows a fruitful approximation between International Relations and other social sciences with elements of computing. Initially thought for the specific project, the merit of this research can be used for several other analyses, in an operational way, and easily adapted to modern software. Once the database was operationalized, the pre-reading of the material led to changes in the analysis intentions, which is why analysis scripts were not continued.O presente artigo provém de um Projeto de Iniciação Científica da UFPB, com o objetivo de criar rotinas de programação para coletar, tratar, organizar e analisar o corpus textual da pesquisa. O projeto se origina na compreensão da importância da mudança do discurso político como indicador da saliência doméstica de normas internacionais, neste caso, a agenda de desenvolvimento global expressa pelos Objetivos do Desenvolvimento Sustentável (ODS). De início, a pesquisa partiu no esforço de construir uma base de dados extensiva, contendo a totalidade dos discursos dos Presidentes da República do Brasil desde 1985, marco da redemocratização do País. Como aparato conceitual, compreende-se saliência como a variação da legitimidade das normas internacionais em um contexto doméstico, medido por meio de mudanças institucionais, políticas e de discurso, ou retóricas. Tratando sobre um período tão longo, observou-se a mudança na forma de armazenamento do acervo da Presidência da República, das quais decorreu a necessidade de criação de scripts específicos para automatizar a coleta e o tratamento dos dados de forma operacional para análises futuras. Como resultado, este trabalho descreve as tecnologias desenvolvidas, na forma de scripts na linguagem Python, para a construção de um corpus textual extenso, de mais de seis mil discursos, e adaptável para a coleta futura. Além de ultrapassar a falta de padronização e sistematização decorrentes de mudanças de governo e tecnologias, o resultado evidencia uma aproximação frutífera entre as Relações Internacionais e demais ciências sociais com elementos da computação. Inicialmente pensado para o projeto específico, o mérito desta pesquisa pode ser utilizado para diversas outras análises, de forma operacionalizável, e facilmente adequada a softwares modernos. Operacionalizada a base de dados, a pré-leitura do material motivou mudanças nas pretensões de análise, razão pela qual scripts para análise não foram continuados.Universidade Federal da ParaíbaBrasilCiências Sociais AplicadasUFPBGonçalves, Pascoal Teófilo CarvalhoGondim, Romberg de Sá2023-06-22T17:23:05Z2023-06-22T17:23:05Z2023-03-09info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/bachelorThesishttps://repositorio.ufpb.br/jspui/handle/123456789/27186porAttribution-NoDerivs 3.0 Brazilhttp://creativecommons.org/licenses/by-nd/3.0/br/info:eu-repo/semantics/openAccessreponame:Biblioteca Digital de Teses e Dissertações da UFPBinstname:Universidade Federal da Paraíba (UFPB)instacron:UFPB2023-06-23T06:03:47Zoai:repositorio.ufpb.br:123456789/27186Biblioteca Digital de Teses e Dissertaçõeshttps://repositorio.ufpb.br/PUBhttp://tede.biblioteca.ufpb.br:8080/oai/requestdiretoria@ufpb.br|| bdtd@biblioteca.ufpb.bropendoar:2023-06-23T06:03:47Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB)false |
| dc.title.none.fl_str_mv |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| title |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| spellingShingle |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual Gondim, Romberg de Sá Pesquisa qualitativa Coleta de dados Tratamento de dados Análise de conteúdo Discurso Político Rotinas de programação CNPQ::OUTROS::RELACOES INTERNACIONAIS |
| title_short |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| title_full |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| title_fullStr |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| title_full_unstemmed |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| title_sort |
Soluções para coleta e tratamento de dados qualitativos sobre difusão e apropriação da Agenda 2030: a linguagem Python aplicada à construção de um corpus textual |
| author |
Gondim, Romberg de Sá |
| author_facet |
Gondim, Romberg de Sá |
| author_role |
author |
| dc.contributor.none.fl_str_mv |
Gonçalves, Pascoal Teófilo Carvalho |
| dc.contributor.author.fl_str_mv |
Gondim, Romberg de Sá |
| dc.subject.por.fl_str_mv |
Pesquisa qualitativa Coleta de dados Tratamento de dados Análise de conteúdo Discurso Político Rotinas de programação CNPQ::OUTROS::RELACOES INTERNACIONAIS |
| topic |
Pesquisa qualitativa Coleta de dados Tratamento de dados Análise de conteúdo Discurso Político Rotinas de programação CNPQ::OUTROS::RELACOES INTERNACIONAIS |
| description |
This article comes from a Scientific Initiation research Project at UFPB, with the objective of creating programming scripts to collect, clean, organize and analyze the textual corpus of the research. The project stems from understanding the importance of changing political discourse as an indicator of the domestic salience of international norms, in this case, the global development agenda expressed by the Sustainable Development Goals (SDGs). Initially, the research started with the effort to build an extensive database, containing all the speeches of the Presidents of the Republic of Brazil since 1985, a milestone of the country's redemocratization. As a conceptual apparatus, salience is understood as the variation in the legitimacy of international norms in a domestic context, measured through institutional, political and discourse or rhetoric changes. Dealing with such a long period, there was a change in the way of storing the collection of the Presidency of the Republic, which resulted in the need to create specific scripts to automate the collection and processing of data in an operational way for future analysis. As a result, this work describes the technologies developed, in the form of scripts in the Python language, for the construction of an extensive textual corpus, with more than six thousand speeches, and adaptable for future collection. In addition to overcoming the lack of standardization and systematization resulting from changes in government and technologies, the result shows a fruitful approximation between International Relations and other social sciences with elements of computing. Initially thought for the specific project, the merit of this research can be used for several other analyses, in an operational way, and easily adapted to modern software. Once the database was operationalized, the pre-reading of the material led to changes in the analysis intentions, which is why analysis scripts were not continued. |
| publishDate |
2023 |
| dc.date.none.fl_str_mv |
2023-06-22T17:23:05Z 2023-06-22T17:23:05Z 2023-03-09 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/bachelorThesis |
| format |
bachelorThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
https://repositorio.ufpb.br/jspui/handle/123456789/27186 |
| url |
https://repositorio.ufpb.br/jspui/handle/123456789/27186 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ info:eu-repo/semantics/openAccess |
| rights_invalid_str_mv |
Attribution-NoDerivs 3.0 Brazil http://creativecommons.org/licenses/by-nd/3.0/br/ |
| eu_rights_str_mv |
openAccess |
| dc.publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Ciências Sociais Aplicadas UFPB |
| publisher.none.fl_str_mv |
Universidade Federal da Paraíba Brasil Ciências Sociais Aplicadas UFPB |
| dc.source.none.fl_str_mv |
reponame:Biblioteca Digital de Teses e Dissertações da UFPB instname:Universidade Federal da Paraíba (UFPB) instacron:UFPB |
| instname_str |
Universidade Federal da Paraíba (UFPB) |
| instacron_str |
UFPB |
| institution |
UFPB |
| reponame_str |
Biblioteca Digital de Teses e Dissertações da UFPB |
| collection |
Biblioteca Digital de Teses e Dissertações da UFPB |
| repository.name.fl_str_mv |
Biblioteca Digital de Teses e Dissertações da UFPB - Universidade Federal da Paraíba (UFPB) |
| repository.mail.fl_str_mv |
diretoria@ufpb.br|| bdtd@biblioteca.ufpb.br |
| _version_ |
1831313887997198336 |