Detecção de viés ideológico de portais de notícias na Web

Detalhes bibliográficos
Ano de defesa: 2020
Autor(a) principal: Aires, Victoria Patricia Silva
Outros Autores: http://lattes.cnpq.br/2689243372205269
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal do Amazonas
Instituto de Computação
Brasil
UFAM
Programa de Pós-graduação em Informática
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Web
Link de acesso: https://tede.ufam.edu.br/handle/tede/7932
Resumo: Nos dias atuais, websites ou portais de notícias são os principais meios pelos quais as pessoas consomem informação. Entretanto, assim como mídias tradicionais, esses veículos podem ter um viés na maneira como reportam notícias, favorecendo uma ideologia de interesse. Combinado às mídias sociais e à facilidade de compartilhamento e alcance desse tipo de conteúdo, esse fato contribui fortemente para a polarização, crimes de ódio e outras consequências na opinião pública. Para tornar as informações mais transparentes ao público, é necessário desenvolver métodos para caracterizar a orientação ideológica destes portais automaticamente. Abordagens propostas recentemente não são exatamente adequadas para este problema, pois dependem, em sua maioria, de fontes externas, gerando resultados imprecisos caso contrário. Diante disso, neste trabalho apresentamos métodos para detectar viés ideológico em portais de notícias baseado apenas nos artigos de notícias oriundos destes portais, sem nenhuma fonte externa. Exploramos duas abordagens: análise de hiperlinks e conteúdo textual. O objetivo é demonstrar a eficiência e eficácia dessa estratégia comparada à literatura atual. Como resultados, mostramos que uma abordagem baseada em hiperlinks é capaz de detectar viés ideológico em um cenário polarizado através de um método baseada em padrões de citações. Além disso, apresentamos uma abordagem baseada em conteúdo textual associada a conceitos de Teoria da Informação e mostramos que o método é capaz de superar um baseline mais tradicional, obtendo quase o dobro de acurácia/F1 em três bases de dados e três tarefas de classificação diferentes (bi-classe e multi-classe), enquanto emprega um conjunto de apenas quatro atributos (contra 282 do baseline) na detecção de diferentes níveis de viés ideológico em portais de notícias.