SSSD : explorando modelos pré-treinados e busca semântica para detecção de posicionamentos no Twitter

Detalhes bibliográficos
Ano de defesa: 2023
Autor(a) principal: Sousa, Andre Mediote de
Orientador(a): Becker, Karin
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Não Informado pela instituição
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Palavras-chave em Inglês:
Link de acesso: http://hdl.handle.net/10183/271370
Resumo: Neste trabalho, é apresentado o SSSD (Semantic Search Stance Detection), um método inovador baseado no paradigma de Aprendizado de Máquina Few-shot Learning para Detecção de Posicionamentos (DP). Esta técnica emprega Modelos Pré-treinados (MPTs) para otimizar DP em tweets através da Busca Semântica. O SSSD tem a capacidade de interpretar o contexto e classificar o conteúdo dos tweets de maneira eficiente, requerendo apenas um conjunto pequeno de exemplos rotulados, o que contribui substancialmente para a redução do esforço manual de rotulagem e dos recursos necessários para o treinamento de modelos de DP. A estratégia proposta aprimora a precisão da DP ao filtrar conteúdos irrelevantes e focar nas postagens mais pertinentes. O SSSD destaca-se por ser pioneiro na integração de MPTs e Busca Semântica, facilitando a superação de desafios relacionados à escassez de dados rotulados e promovendo a melhoria da DP em mídias sociais. Em experimentos que tomaram como referência a competição SemEval-2016 Tarefa 6, o SSSD superou todos os benchmarks estabelecidos, evidenciando um potencial significativo na economia de recursos. Foi realizada ainda uma análise qualitativa para avaliar a eficácia do SSSD na detecção de posicionamentos relacionados à campanha de vacinação no Brasil durante a pandemia de COVID-19. Os resultados confirmam que o SSSD apresenta bons resultados mesmo com um volume limitado de dados rotulados, diferenciando-o positivamente em comparação com outras metodologias.