Evaluation of machine learning classifiers in ordinal multiclass fake news detection scenario

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: Coutinho, Igor Bichara de Azeredo
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: eng
Instituição de defesa: Universidade Federal do Rio de Janeiro
Brasil
Instituto Alberto Luiz Coimbra de Pós-Graduação e Pesquisa de Engenharia
Programa de Pós-Graduação em Engenharia de Sistemas e Computação
UFRJ
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://hdl.handle.net/11422/14047
Resumo: [EN] This thesis intends to explore machine learning classifiers and techniques to address the problem of fake news detection. Prediction algorithms can generate different results in this problem due to variance in dataset labeling caused by ambiguity and subjectivity of semantic text. The LIAR Dataset was used in the experiments of this thesis. This dataset derived from PolitiFact fact-checking agency data which is composed of a 6-class ordinal labeling that places political statements in the range between completely false and completely true statements. The original experiment that created the dataset achieved 27.4% class accuracy using hybrid CNN and Bi-Directional LSTM networks. The main contribution of this work consists of evaluating simpler classifiers focusing on using different preprocessing and feature selection techniques when modeling metadata and text features. Furthermore, this work explores the ordinal characteristics of the class labels and uses simple binary classifiers in an ordinal ensemble method already established in the literature.