Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online
| Autor(a) principal: | |
|---|---|
| Data de Publicação: | 2022 |
| Tipo de documento: | Dissertação |
| Idioma: | por |
| Título da fonte: | Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| Texto Completo: | http://hdl.handle.net/10773/35068 |
Resumo: | Os meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”. |
| id |
RCAP_578cc1d48ae072c4d942a6b2db5a4e71 |
|---|---|
| oai_identifier_str |
oai:ria.ua.pt:10773/35068 |
| network_acronym_str |
RCAP |
| network_name_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository_id_str |
https://opendoar.ac.uk/repository/7160 |
| spelling |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses onlineClassificação de textoClassificação automáticaInteligência artificialJornais de notíciasProcessamento de linguagem naturalMachine learningDeep learningTopic modelingOs meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”.The media, namely the written newspapers available on the Internet are primarily responsible for providing information to the public and have a great influence on shaping our society. The presence of stigma related to mental health remains frequent in the articles published online, where mental diseases are often used metaphorically to refer to entities or situations outside the clinical context of mental health. Considering that the manual analysis of this problem requires a great deal of human effort and time, this project explores the implementation of Artificial Intelligence and Natural Language Processing techniques for the task of automatically classifying stigmatizing articles on the mental disorders of schizophrenia and psychosis, present in Portuguese online newspapers and collected from the public repository Arquivo.pt. Ten machine learning and deep learning algorithms were implemented to perform this task, and 45% of the models led to results with accuracy above 90%. In addition, the automatic detection of the articles topics was also performed, through topic modeling with the top2vec model, which allowed to conclude that the stigmatization of mental health occurs, essentially, in the topics of Economics and Politics. The experimental results confirm the existence of stigma in Portuguese online newspapers (52% of the 978 articles collected) and the effectiveness of the use of Artificial Intelligence to detect it. Additionally, a set of 978 articles collected and manually annotated with the classes “stigmatizing” and “literal” is created and made available.2022-11-02T15:00:09Z2022-07-28T00:00:00Z2022-07-28info:eu-repo/semantics/publishedVersioninfo:eu-repo/semantics/masterThesisapplication/pdfhttp://hdl.handle.net/10773/35068porYanchuk, Alinainfo:eu-repo/semantics/openAccessreponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP)instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiainstacron:RCAAP2024-05-06T04:40:10Zoai:ria.ua.pt:10773/35068Portal AgregadorONGhttps://www.rcaap.pt/oai/openaireinfo@rcaap.ptopendoar:https://opendoar.ac.uk/repository/71602025-05-28T14:16:27.428328Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologiafalse |
| dc.title.none.fl_str_mv |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| title |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| spellingShingle |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online Yanchuk, Alina Classificação de texto Classificação automática Inteligência artificial Jornais de notícias Processamento de linguagem natural Machine learning Deep learning Topic modeling |
| title_short |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| title_full |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| title_fullStr |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| title_full_unstemmed |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| title_sort |
Classificação automática de artigos estigmatizantes de doenças mentais em jornais de notícias portugueses online |
| author |
Yanchuk, Alina |
| author_facet |
Yanchuk, Alina |
| author_role |
author |
| dc.contributor.author.fl_str_mv |
Yanchuk, Alina |
| dc.subject.por.fl_str_mv |
Classificação de texto Classificação automática Inteligência artificial Jornais de notícias Processamento de linguagem natural Machine learning Deep learning Topic modeling |
| topic |
Classificação de texto Classificação automática Inteligência artificial Jornais de notícias Processamento de linguagem natural Machine learning Deep learning Topic modeling |
| description |
Os meios de comunicação social, nomeadamente os jornais de notícias presentes na Internet, são os principais responsáveis pelo fornecimento de informação ao público e possuem uma grande influência na modelação da nossa sociedade. A presença de estigma associado à saúde mental continua a ser frequente nos artigos publicados nos mesmos, onde, muitas vezes, as doenças mentais são utilizadas de forma metafórica para se referir a entidades ou situações fora do contexto clínico da saúde mental. Tendo em conta que a análise manual deste problema requer um grande esforço humano e tempo, este projeto explora a implementação de técnicas de Inteligência Artificial e de Processamento de Linguagem Natural para a tarefa de classificação automática de artigos estigmatizantes dos transtornos mentais da esquizofrenia e psicose, presentes em jornais de notícias portugueses online e recolhidos do repositório público Arquivo.pt. Foram implementados dez algoritmos de machine learning e deep learning para a realização desta tarefa, sendo que 45% dos modelos permitiram obter resultados com exatidão acima dos 90%. Além disso, foi também realizada a deteção automática de tópicos presentes nos artigos, através de topic modeling com o modelo top2vec, que permitiu concluir que a estigmatização da saúde mental ocorre, essencialmente, nas temáticas da Economia e Política. Os resultados experimentais confirmam a existência de estigma nos jornais de notícias portugueses (52% dos 978 artigos recolhidos) e a eficácia da utilização de modelos computacionais para a sua deteção. Adicionalmente, é criado e disponibilizado um conjunto de 978 artigos recolhidos e manualmente anotados com as classes “estigmatizante” e “literal”. |
| publishDate |
2022 |
| dc.date.none.fl_str_mv |
2022-11-02T15:00:09Z 2022-07-28T00:00:00Z 2022-07-28 |
| dc.type.status.fl_str_mv |
info:eu-repo/semantics/publishedVersion |
| dc.type.driver.fl_str_mv |
info:eu-repo/semantics/masterThesis |
| format |
masterThesis |
| status_str |
publishedVersion |
| dc.identifier.uri.fl_str_mv |
http://hdl.handle.net/10773/35068 |
| url |
http://hdl.handle.net/10773/35068 |
| dc.language.iso.fl_str_mv |
por |
| language |
por |
| dc.rights.driver.fl_str_mv |
info:eu-repo/semantics/openAccess |
| eu_rights_str_mv |
openAccess |
| dc.format.none.fl_str_mv |
application/pdf |
| dc.source.none.fl_str_mv |
reponame:Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) instname:FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia instacron:RCAAP |
| instname_str |
FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| instacron_str |
RCAAP |
| institution |
RCAAP |
| reponame_str |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| collection |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) |
| repository.name.fl_str_mv |
Repositórios Científicos de Acesso Aberto de Portugal (RCAAP) - FCCN, serviços digitais da FCT – Fundação para a Ciência e a Tecnologia |
| repository.mail.fl_str_mv |
info@rcaap.pt |
| _version_ |
1833594453460254720 |