Assimilando a análise de sentimento no aprendizado por reforço para negociação inteligente.

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Paiva, Francisco Caio Lima
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/3/3141/tde-20102023-152926/
Resumo: A viabilidade de obter lucro por meio de negociação em alta frequência de um único ativo financeiro é uma questão de pesquisa em aberto. O aprendizado por reforço (RL) e a análise de sentimentos textual (SA) são cada vez mais relevantes para esse problema financeiro. Notavelmente, apesar de sua proeminência, as técnicas de RL e SA raramente foram combinadas para aprender estratégias de negociação de ativos. Além disso, os tópicos não abordados incluem: capturar o impulso do sentimento do mercado por meio da extração explícita de características de sentimento que refletem a condição do mercado ao longo do tempo; e verificar se tal incorporação de informações aos algoritmos de RL não afeta negativamente a consistência e estabilidade em diferentes situações. O presente trabalho propõe que o Sentiment-Aware Reinforcement Learning Intelligent Trading System (ITS-SentARL) preencha esta lacuna. O ITS-SentARL melhora o lucro e a estabilidade ao alavancar o humor do mercado por meio de uma faixa ajustável de recursos de sentimentos obtidos de notícias textuais. Ao contrário de pesquisas anteriores, projetamos um extrator de sentimentos de acordo com o design vencedor da rede neural convolucional da competição de análise de sentimentos SemEval-2017 { o treinamento desse extrator de sentimentos foi feito com dados rotulados por especialistas de mercado. Depois de treinar o extrator de sentimento, ele pode ser usado para pontuar novos dados e usá-los como parte da representação de estado de um algoritmo Advantage Actor-Critic (A2C), uma abordagem RL. Tanto uma estratégia A2C sem sentimentos quanto a estratégia clássica de compra e retenção (BH) são usadas como linhas de base. A avaliação da arquitetura ITS-SentARL ocorre em vinte ativos financeiros, dois custos de transação e cinco diferentes períodos e inicializações. Notavelmente, os resultados mostram que o agente ITS-SentARL superou consistentemente o agente de negociação A2C de linha de base para diversas situações de mercado e, em alguns cenários, também a estratégia BH. Os resultados sugerem que a incorporação do sentimento de mercado é benéfica, mas depende da quantidade de notícias divulgadas e sua correlação com o preço.