Classificações de notícias falsas baseadas em similaridade semântica a partir de léxicos automaticamente construídos.
Ano de defesa: | 2022 |
---|---|
Autor(a) principal: | |
Orientador(a): | |
Banca de defesa: | |
Tipo de documento: | Tese |
Tipo de acesso: | Acesso aberto |
Idioma: | por |
Instituição de defesa: |
Universidade Federal de Campina Grande
Brasil Centro de Engenharia Elétrica e Informática - CEEI PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO UFCG |
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: | |
Link de acesso: | http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/25060 |
Resumo: | Métodos de detecção de notícias falsas baseados unicamente em características textuais permitem uma detecção precoce deste tipo de conteúdo. Esta estratégia de detecção não necessita de informações como o número de curtidas ou quantidade de compartilhamentos, informações disponíveis apenas quando a notícia já tem se disseminado nas redes sociais. Dentro deste escopo, o uso de léxicos como recurso para auxiliar na construção de features de classificação se destaca por ser um recurso capaz de agregar um conhecimento prévio ao processo de classificação. Porém, a construção deste tipo de recurso muitas vezes exige a participação de especialistas no processo, o que em muitos contextos, torna o processo muito custoso ou mesmo inviável. Nesta pesquisa, é proposto um método para a construção automática de léxicos voltados para a análise e classificação de notícias falsas. O método proposto utiliza documentos de notícias falsas e reais, onde são extraídos termos que auxiliam na diferenciação destes dois tipos de documentos. Também é proposta, a partir dos léxicos gerados, uma estratégia para a construção de features de classificação baseados em similaridade semântica. Nesta pesquisa, avaliamos e comparamos modelos treinados a partir dos léxicos gerados automaticamente com modelos treinados utilizando léxicos já presentes na literatura. Como principais resultados, foi possível verificar que os modelos que utilizaram os léxicos construídos nesta pesquisa se mostraram superiores em diferentes cenários, como também apresentaram, de forma sistemática, melhores resultados quando utilizados em conjunto com os léxicos já existentes na literatura. Por fim, é apresentada uma análise da explicabilidade dos modelos, permitindo revelar nuances das notícias falsas que só puderam ser observadas com o auxílio dos léxicos gerados nesta pesquisa. |