Detalhes bibliográficos
Ano de defesa: |
2019 |
Autor(a) principal: |
Rodrigues, André Terreri |
Orientador(a): |
Giovannetti, Bruno Cara |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Não Informado pela instituição
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Palavras-chave em Inglês: |
|
Link de acesso: |
https://hdl.handle.net/10438/27642
|
Resumo: |
Dados textuais, como notícias de jornais, contêm informações econômicas relevantes, sendo importante na formação das expectativas dos agentes econômicos. Essas informações, se devidamente quantificadas, podem ser eficazes na análise do estado atual da economia (nowcast) ou na sua previsão. Com o advento de técnicas de machine learning, mais especificamente as de Processamento de Linguagem Natural (NLP, Natural Language Processing), desenvolvidas para lidar com dados textuais, é possível extrair os tópicos e o sentimento de um texto. Utilizando-se de Latent Dirichlet Allocation (LDA) (BLEI; NG; JORDAN, 2003), um processo probabilístico generativo de documentos, foi inferida a distribuição de tópicos em um corpus de mais de 135,000 notícias do jornal Valor Econômico, jornal especializado em economia e finanças de maior circulação no Brasil. Além disso, através de um léxico de sentimento e Análise de Sentimento, foi aferido o sentimento de cada notícia a partir de suas palavras. Com a informação dos tópicos e dos sentimentos das notícias, foram criados indicadores de tópico-sentimento que se mostraram correlacionados a indicadores econômicos, como indicadores de confiança e índices de inflação, e que tem como vantagem ter frequência diária e poderem ser expandidos para novos conjuntos de textos. A utilização de LDA para a língua portuguesa é ainda pequena, e sua aplicação em Economia para o caso brasileiro é aparentemente inexistente, este trabalho contribui em ambos os casos; mostrando as adaptações necessárias às técnicas já desenvolvidas para a língua inglesa, e evidenciando a utilidade de dados textuais na análise econômica. |