Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online

Detalhes bibliográficos
Autor(a) principal: Yanchuk, Alina
Data de Publicação: 2022
Tipo de documento: Dissertação
Idioma: por
Título da fonte: Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
Texto Completo: http://hdl.handle.net/10773/35068
Resumo: Os meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”.
id RCAP_578cc1d48ae072c4d942a6b2db5a4e71
oai_identifier_str oai:ria.ua.pt:10773/35068
network_acronym_str RCAP
network_name_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository_id_str https://opendoar.ac.uk/repository/7160
spelling Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses onlineClassificação de textoClassificação automáticaInteligência artificialJornais de notíciasProcessamento de linguagem naturalMachine learningDeep learningTopic modelingOs meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”.The media, namely the written newspapers available on the Internet are primarily responsible for providing information to the public and have a great influence on shaping our society. The presence of stigma related to mental health remains frequent in the articles published online, where mental diseases are often used metaphorically to refer to entities or situations outside the clinical context of mental health. Considering that the manual analysis of this problem requires a great deal of human effort and time, this project explores the implementation of Artificial Intelligence and Natural Language Processing techniques for the task of automatically classifying stigmatizing articles on the mental disorders of schizophrenia and psychosis, present in Portuguese online newspapers and collected from the public repository Arquivo.pt. Ten machine learning and deep learning algorithms were implemented to perform this task, and 45% of the models led to results with accuracy above 90%. In addition, the automatic detection of the articles topics was also performed, through topic modeling with the top2vec model, which allowed to conclude that the stigmatization of mental health occurs, essentially, in the topics of Economics and Politics. The experimental results confirm the existence of stigma in Portuguese online newspapers (52% of the 978 articles collected) and the effectiveness of the use of Artificial Intelligence to detect it. Additionally, a set of 978 articles collected and manually annotated with the classes “stigmatizing” and “literal” is created and made available.2022-11-02T15:00:09Z2022-07-28T00:00:00Z2022-07-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/35068porYanchuk, Alinainfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-06T04:40:10Zoai:ria.ua.pt:10773/35068Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T14:16:27.428328Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse
dc.title.none.fl_str_mv Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
title Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
spellingShingle Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
Yanchuk, Alina
Classificação de texto
Classificação automática
Inteligência artificial
Jornais de notícias
Processamento de linguagem natural
Machine learning
Deep learning
Topic modeling
title_short Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
title_full Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
title_fullStr Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
title_full_unstemmed Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
title_sort Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
author Yanchuk, Alina
author_facet Yanchuk, Alina
author_role author
dc.contributor.author.fl_str_mv Yanchuk, Alina
dc.subject.por.fl_str_mv Classificação de texto
Classificação automática
Inteligência artificial
Jornais de notícias
Processamento de linguagem natural
Machine learning
Deep learning
Topic modeling
topic Classificação de texto
Classificação automática
Inteligência artificial
Jornais de notícias
Processamento de linguagem natural
Machine learning
Deep learning
Topic modeling
description Os meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”.
publishDate 2022
dc.date.none.fl_str_mv 2022-11-02T15:00:09Z
2022-07-28T00:00:00Z
2022-07-28
dc.type.status.fl_str_mv info:eu-repo/semantics/publishedVersion
dc.type.driver.fl_str_mv info:eu-repo/semantics/masterThesis
format masterThesis
status_str publishedVersion
dc.identifier.uri.fl_str_mv http://hdl.handle.net/10773/35068
url http://hdl.handle.net/10773/35068
dc.language.iso.fl_str_mv por
language por
dc.rights.driver.fl_str_mv info:eu-repo/semantics/openAccess
eu_rights_str_mv openAccess
dc.format.none.fl_str_mv application/pdf
dc.source.none.fl_str_mv reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron:RCAAP
instname_str FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
instacron_str RCAAP
institution RCAAP
reponame_str Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
collection Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)
repository.name.fl_str_mv Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia
repository.mail.fl_str_mv info@rcaap.pt
_version_ 1833594453460254720