Detalhes bibliográficos
Ano de defesa: |
2020 |
Autor(a) principal: |
Silva, Flávio Roberto Matias da |
Orientador(a): |
Goldschmidt, Ronaldo Ribeiro |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Instituto Militar de Engenharia (IME)
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.repositorio.mar.mil.br/handle/ripcmb/845427
|
Resumo: |
Devido ao fácil acesso e ao baixo custo, o consumo de notícias on-line em redes sociais aumentou significativamente na última década. Apesar de seus benefícios, algumas redes sociais permitem que qualquer pessoa divulgue notícias com intenso poder de difusão, o que amplia um problema antigo: a disseminação do fake news (i.e., notícias falsas veiculadas de forma intencional). A proliferação de fake news, geralmente, afeta não apenas a integridade jornalística, mas também perturba as áreas social, política, econômica, cultural, assim como da saúde e segurança. Diante desse cenário, foram propostos vários métodos baseados em aprendizado de máquina para detectar automaticamente fake news (machine learningbased methods to automatically detect fake news- MLFN). Esses métodos necessitam de datasets para treinar e avaliar seus modelos de detecção. Embora os MLFN recentes tenham sido projetados para considerar dados sobre a propagação de notícias em redes sociais, poucos dos datasets disponíveis contêm esses dados. Assim, a comparação de desempenho entre MLFN está restrita à utilização de um número limitado de datasets. Além disso, os datasets existentes com dados de propagação não contêm notícias em português, o que prejudica a avaliação do MLFN nesse idioma. Portanto, este trabalho propõe o FakeNewsSetGen, um processo de construção de datasets para o estudo de fake news que contenham dados de propagação de notícias e viabilizem a comparação entre MLFN. O processo de engenharia de software do FakeNewsSetGen foi orientado para incluir todos os tipos de dados exigidos pelos MLFN existentes. Para ilustrar a viabilidade e adequação do FakeNewsSetGen, foi realizado um estudo de caso que abrange a implementação de um protótipo do FakeNewsSetGen e a aplicação desse protótipo para criar uma instância de dataset denominada FakeNewsSet, composta de notícias em português. Dez MLFN com diferentes tipos de requisitos de dados (sete deles exigindo dados de propagação de notícias) foram aplicados ao FakeNewsSet e comparados, demonstrando o potencial de utilização do processo proposto e do dataset criado. |