Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades

Detalhes bibliográficos
Autor(a) principal: Ferreira, Fernanda Vasques
Data de Publicação: 2022
Outros Autores: Varão, Rafiza, Boselli, Marco Aurélio, Santos, Leandro Brito, Moret, Marcelo A.
Tipo de documento: Artigo
Idioma: por
Título da fonte: Repositório Institucional da FIOCRUZ (ARCA)
DOI: 10.29397/reciis.v16i2.3253
Texto Completo: https://arca.fiocruz.br/handle/icict/54387
Resumo: Fernanda Vasques Ferreira do Centro Universitário Senai Cimatec, da Faculdade de Tecnologia, da Universidade Federal do Oeste da Bahia, do Centro Multidisciplinar de Santa Maria da Vitória teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)
id CRUZ_e45a56a1ce88694707a9c3d03a4afcd3
oai_identifier_str oai:arca.fiocruz.br:icict/54387
network_acronym_str CRUZ
network_name_str Repositório Institucional da FIOCRUZ (ARCA)
repository_id_str 2135
spelling Ferreira, Fernanda VasquesVarão, RafizaBoselli, Marco AurélioSantos, Leandro BritoMoret, Marcelo A.2022-08-04T11:31:53Z2022-08-04T11:31:53Z2022FERREIRA, Fernanda Vasques et al. Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades. RECIIS - Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 16, n. 2, p. 266-280, abr./jun. 2022.1981-6278https://arca.fiocruz.br/handle/icict/5438710.29397/reciis.v16i2.32531981-6278Fernanda Vasques Ferreira do Centro Universitário Senai Cimatec, da Faculdade de Tecnologia, da Universidade Federal do Oeste da Bahia, do Centro Multidisciplinar de Santa Maria da Vitória teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)Rafiza Varão da Universidade de Brasília, da Faculdade de Comunicação teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)Marco Aurélio Boselli da Universidade Federal de Uberlândia, do Instituto de Física teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)Leandro Brito Santos da Universidade Federal do Oeste da Bahia, do Centro Multidisciplinar de Bom Jesus da Lapa teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)Marcelo A. Moret do Centro Universitário Senai Cimatec, da Faculdade de Tecnologia, da Universidade do Estado da Bahia teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)Este trabalho tem como objetivo relatar estratégias para coleta de um conjunto de dados em português para treinamento de modelos de Inteligência Artificial com vistas a identificar de forma automática fake news sobre covid-19 disseminadas durante a pandemia, a partir de código Python. Analisamos um método de detecção de fake news baseado em uma Rede Neural Recorrente e de aprendizagem supervisionada. Selecionamos um corpus com 7,2 mil textos coletados em websites e agências de notícias por Monteiro et al. (2018) com cada um previamente catalogado como verdadeiro ou falso como conjunto de dados de treino e validação. O modelo foi usado para detecção de fake news sobre covid-19 em um conjunto de notícias coletadas e classificadas pelos autores deste trabalho. O índice de acerto foi de 70%, ou seja, essa foi a taxa de sucesso da detecção dos itens catalogados.This work aims to report strategies for collecting a dataset in Portuguese for training Artificial Intelligence models to automatically identify fake news about covid-19 disseminated during the pandemic, using Python code. We analyze a fake news detection method based on a Recurrent Neural Network and supervised learning. We selected a corpus with 7,200 texts collected on websites and news agencies by Monteiro et al. (2018), each one of them previously cataloged as true or false as a training and validation dataset. This model was used to detect fake news about covid-19 in a set of news collected and classified by the authors of this work. The hit rate was 70%.Este trabajo tiene como objetivo informar estrategias para recopilar un conjunto de datos en portugués para entrenar modelos de Inteligencia Artificial para identificar automáticamente noticias falsas sobre covid-19 difundidas durante la pandemia, utilizando el código Python. Analizamos un método de detección de noticias falsas basado en una Red Neuronal Recurrente y de aprendizaje supervisado. Seleccionamos un corpus de 7.200 textos recogidos en webs y agencias de noticias por Monteiro et al. (2018) con cada uno catalogado previamente como verdadero o falso como un conjunto de datos de entrenamiento y validación. El modelo se utilizó para detectar noticias falsas sobre covid-19 en un conjunto de noticias recopiladas y clasificadas por los autores de este trabajo. La tasa de acierto fue del 70%, es decir, esta fue la tasa de éxito de detección de los artículos catalogados.Centro Universitário Senai Cimatec. Faculdade de Tecnologia. Salvador, BA, Brasil / Universidade Federal do Oeste da Bahia. Centro Multidisciplinar de Santa Maria da Vitória. Santa Maria da Vitória, BA, Brasil.Universidade de Brasília. Faculdade de Comunicação. Brasília, DF, Brasil.Universidade Federal de Uberlândia. Instituto de Física. Uberlândia, MG, Brasil.Universidade Federal do Oeste da Bahia. Centro Multidisciplinar de Bom Jesus da Lapa. Bom Jesus da Lapa, BA, Brasil.Centro Universitário Senai Cimatec. Faculdade de Tecnologia. Salvador, BA, Brasil / Universidade do Estado da Bahia. Salvador, BA, Brasil.porFundação Oswaldo Cruz. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde.Fake newsInteligência artificialCOVID-19PythonDesinformaçãoFake newsArtificial IntelligenceCOVID-19PythonMisinformationNoticias falsasInteligencia artificialCOVID-19PythonDesinformaciónUso de Python para detecção de fake news sobre a covid-19: desafios e possibilidadesUsing Python to detect fake news about covid-19: challenges and possibilitiesinfo:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/articleinfo:eu-repo/semantics/openAccessreponame:Repositório Institucional da FIOCRUZ (ARCA)instname:Fundação Oswaldo Cruz (FIOCRUZ)instacron:FIOCRUZLICENSElicense.txttext/plain1748https://arca.fiocruz.br/bitstreams/7cbb7a6a-506a-4f1e-b767-0dd2979e19c8/download8a4605be74aa9ea9d79846c1fba20a33MD51falseAnonymousREADORIGINAL3253-11692-1-PB.pdfapplication/pdf775826https://arca.fiocruz.br/bitstreams/09366831-a8da-4945-a458-53080ad544f1/download29590f591a19eaea536c0592a6d7881aMD52trueAnonymousREADTEXT3253-11692-1-PB.pdf.txt3253-11692-1-PB.pdf.txtExtracted texttext/plain67924https://arca.fiocruz.br/bitstreams/5dc87d90-38e2-4905-ba41-7be52c186388/downloadc42dc3bb38ead1508c7875c909bf0564MD57falseAnonymousREADTHUMBNAIL3253-11692-1-PB.pdf.jpg3253-11692-1-PB.pdf.jpgGenerated Thumbnailimage/jpeg5111https://arca.fiocruz.br/bitstreams/9805546c-abac-4f15-8208-e4bd7b2082e2/download42cb22068dbfa922f4d8f674b98c7604MD58falseAnonymousREADicict/543872025-07-29 21:11:48.563open.accessoai:arca.fiocruz.br:icict/54387https://arca.fiocruz.brRepositório InstitucionalPUBhttps://www.arca.fiocruz.br/oai/requestrepositorio.arca@fiocruz.bropendoar:21352025-07-30T00:11:48Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)falseTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=
dc.title.none.fl_str_mv Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
dc.title.alternative.none.fl_str_mv Using Python to detect fake news about covid-19: challenges and possibilities
title Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
spellingShingle Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
Ferreira, Fernanda Vasques
Fake news
Inteligência artificial
COVID-19
Python
Desinformação
Fake news
Artificial Intelligence
COVID-19
Python
Misinformation
Noticias falsas
Inteligencia artificial
COVID-19
Python
Desinformación
title_short Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
title_full Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
title_fullStr Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
title_full_unstemmed Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
title_sort Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades
author Ferreira, Fernanda Vasques
author_facet Ferreira, Fernanda Vasques
Varão, Rafiza
Boselli, Marco Aurélio
Santos, Leandro Brito
Moret, Marcelo A.
author_role author
author2 Varão, Rafiza
Boselli, Marco Aurélio
Santos, Leandro Brito
Moret, Marcelo A.
author2_role author
author
author
author
dc.contributor.author.fl_str_mv Ferreira, Fernanda Vasques
Varão, Rafiza
Boselli, Marco Aurélio
Santos, Leandro Brito
Moret, Marcelo A.
dc.subject.other.none.fl_str_mv Fake news
Inteligência artificial
COVID-19
Python
Desinformação
topic Fake news
Inteligência artificial
COVID-19
Python
Desinformação
Fake news
Artificial Intelligence
COVID-19
Python
Misinformation
Noticias falsas
Inteligencia artificial
COVID-19
Python
Desinformación
dc.subject.en.none.fl_str_mv Fake news
Artificial Intelligence
COVID-19
Python
Misinformation
dc.subject.es.none.fl_str_mv Noticias falsas
Inteligencia artificial
COVID-19
Python
Desinformación
description Fernanda Vasques Ferreira do Centro Universitário Senai Cimatec, da Faculdade de Tecnologia, da Universidade Federal do Oeste da Bahia, do Centro Multidisciplinar de Santa Maria da Vitória teve seu artigo submetido e aprovado na edição da RECIIS - Dossiê Perspectivas multidisciplinares sobre desinformação em ciência e saúde, v. 16 n.2 (2022)
publishDate 2022
dc.date.accessioned.fl_str_mv 2022-08-04T11:31:53Z
dc.date.available.fl_str_mv 2022-08-04T11:31:53Z
dc.date.issued.fl_str_mv 2022
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/article
format article
status_str publishedVersion
dc.identifier.citation.fl_str_mv FERREIRA, Fernanda Vasques et al. Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades. RECIIS - Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 16, n. 2, p. 266-280, abr./jun. 2022.
dc.identifier.uri.fl_str_mv https://arca.fiocruz.br/handle/icict/54387
dc.identifier.issn.none.fl_str_mv 1981-6278
dc.identifier.doi.none.fl_str_mv 10.29397/reciis.v16i2.3253
dc.identifier.eissn.none.fl_str_mv 1981-6278
identifier_str_mv FERREIRA, Fernanda Vasques et al. Uso de Python para detecção de fake news sobre a covid-19: desafios e possibilidades. RECIIS - Revista Eletrônica de Comunicação, Informação e Inovação em Saúde, Rio de Janeiro, v. 16, n. 2, p. 266-280, abr./jun. 2022.
1981-6278
10.29397/reciis.v16i2.3253
url https://arca.fiocruz.br/handle/icict/54387
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.publisher.none.fl_str_mv Fundação Oswaldo Cruz. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde.
publisher.none.fl_str_mv Fundação Oswaldo Cruz. Instituto de Comunicação e Informação Científica e Tecnológica em Saúde.
dc.source.none.fl_str_mv reponame:Repositório Institucional da FIOCRUZ (ARCA)
instname:Fundação Oswaldo Cruz (FIOCRUZ)
instacron:FIOCRUZ
instname_str Fundação Oswaldo Cruz (FIOCRUZ)
instacron_str FIOCRUZ
institution FIOCRUZ
reponame_str Repositório Institucional da FIOCRUZ (ARCA)
collection Repositório Institucional da FIOCRUZ (ARCA)
bitstream.url.fl_str_mv https://arca.fiocruz.br/bitstreams/7cbb7a6a-506a-4f1e-b767-0dd2979e19c8/download
https://arca.fiocruz.br/bitstreams/09366831-a8da-4945-a458-53080ad544f1/download
https://arca.fiocruz.br/bitstreams/5dc87d90-38e2-4905-ba41-7be52c186388/download
https://arca.fiocruz.br/bitstreams/9805546c-abac-4f15-8208-e4bd7b2082e2/download
bitstream.checksum.fl_str_mv 8a4605be74aa9ea9d79846c1fba20a33
29590f591a19eaea536c0592a6d7881a
c42dc3bb38ead1508c7875c909bf0564
42cb22068dbfa922f4d8f674b98c7604
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositório Institucional da FIOCRUZ (ARCA) - Fundação Oswaldo Cruz (FIOCRUZ)
repository.mail.fl_str_mv repositorio.arca@fiocruz.br
_version_ 1839716028911714304