Modelagem de tópicos na estimativa de pontos ideais baseados em discursos de parlamentares brasileiros

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: SANTOS, Matheus Alves dos.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36636
Resumo: Para a construção de democracias fortes e verdadeiramente representativas é de suma importância que a sociedade civil seja capaz de compreender e monitorar a atuação política de seus representantes. Entretanto, apesar dos notáveis avanços na transparência governamental, a população brasileira tende a não acompanhar as atividades parlamentares. Esse cenário se consolida em decorrência de múltiplas questões socioculturais, mas também da intrínseca complexidade do Poder Legislativo. Assim, são necessários métodos e ferramentas que proporcionem acesso à informação para a sociedade civil e, mais do que isso, que colaborem com seu entendimento e uso dessas informações. Nesse âmbito, as técnicas de Processamento de Linguagem Natural têm se difundido na análise dos volumosos conjuntos de dados textuais que permeiam o contexto político, como os discursos ou as proposições de lei. Neste trabalho, avaliamos o uso individual e conjunto de duas técnicas do estado-da-arte para a modelagem de tópicos latentes e a estimativa de pontos ideais baseados em texto, aplicando-as à caracterização dos discursos e posicionamentos políticos de parlamentares brasileiros. Em específico, utilizamos os modelos BERTopic e Text-Based Ideal Point para analisar a 55ª e a 56ª Legislaturas da Câmara dos Deputados, abrangendo o período de 2015 a 2022. Durante esse processo, também construímos e publicamos uma base de dados abertos contendo as transcrições dos discursos em eventos realizados por essa casa legislativa entre 2003 e 2022. A avaliação das técnicas adotadas teve caráter quantitativo e qualitativo, considerando métricas como a coerência e a diversidade de tópicos latentes, mas também a validade aparente e o comparativo com a percepção de especialistas da Ciência Política. O desempenho dos modelos nessa avaliação e as análises baseadas em seus resultados apontam essas técnicas como viáveis, promissoras e capazes de fundamentar novos estudos políticos no cenário brasileiro. Contudo, devido às características inerentes ao Poder Legislativo de nosso país, nossas estimativas divergem da interpretação original dos pontos ideais e, substituindo a tradicional dicotomia esquerda-direita, demonstram o quão “ideológicos” ou “pragmáticos” são os indivíduos analisados.