Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.

Detalhes bibliográficos
Ano de defesa: 2022
Autor(a) principal: JERÔNIMO, Caio Libânio Melo.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Tese
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25060
Resumo: Métodos de detecção de notícias falsas baseados unicamente em características textuais permitem uma detecção precoce deste tipo de conteúdo. Esta estratégia de detecção não necessita de informações como o número de curtidas ou quantidade de compartilhamentos, informações disponíveis apenas quando a notícia já tem se disseminado nas redes sociais. Dentro deste escopo, o uso de léxicos como recurso para auxiliar na construção de features de classificação se destaca por ser um recurso capaz de agregar um conhecimento prévio ao processo de classificação. Porém, a construção deste tipo de recurso muitas vezes exige a participação de especialistas no processo, o que em muitos contextos, torna o processo muito custoso ou mesmo inviável. Nesta pesquisa, é proposto um método para a construção automática de léxicos voltados para a análise e classificação de notícias falsas. O método proposto utiliza documentos de notícias falsas e reais, onde são extraídos termos que auxiliam na diferenciação destes dois tipos de documentos. Também é proposta, a partir dos léxicos gerados, uma estratégia para a construção de features de classificação baseados em similaridade semântica. Nesta pesquisa, avaliamos e comparamos modelos treinados a partir dos léxicos gerados automaticamente com modelos treinados utilizando léxicos já presentes na literatura. Como principais resultados, foi possível verificar que os modelos que utilizaram os léxicos construídos nesta pesquisa se mostraram superiores em diferentes cenários, como também apresentaram, de forma sistemática, melhores resultados quando utilizados em conjunto com os léxicos já existentes na literatura. Por fim, é apresentada uma análise da explicabilidade dos modelos, permitindo revelar nuances das notícias falsas que só puderam ser observadas com o auxílio dos léxicos gerados nesta pesquisa.