Detecção de discurso de ódio em comentários relacionados à política.

Detalhes bibliográficos
Ano de defesa: 2024
Autor(a) principal: OLIVEIRA, Aillkeen Bezerra de.
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Campina Grande
Brasil
Centro de Engenharia Elétrica e Informática - CEEI
PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
UFCG
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: http://dspace.sti.ufcg.edu.br:8080/jspui/handle/riufcg/36976
Resumo: Em uma era em que as pessoas estão cada vez mais conectadas, a dispersão de discurso de ódio em redes sociais tornou-se mais frequente. Para contornar esse problema, a tecnologia computacional emergiu como uma ferramenta valiosa para identificar e mitigar discurso de ódio em redes sociais. Diante do poder computacional disponível, este trabalho contempla o uso de Processamento de Linguagem Natural para detectar discurso de ódio em textos prove nientes de redes sociais. Além de abordar a detecção, outro objetivo é investigar o impacto da distância léxica entre os idiomas dos corpora empregados no treinamento dos modelos, ex plorando codificadores e decodificadores baseados na arquitetura de Transformers. Portanto, realizou-se uma investigação sobre a inclusão de Cross-lingual Learning (CLL) para apri morar a detecção de discurso de ódio em diferentes idiomas, empregando diversas técnicas de CLL, bem como a aplicação de múltiplos idiomas como fonte de treino para o mod elo. Os resultados revelaram que a aplicação de CLL, especialmente com múltiplos idiomas fonte, melhorou significativamente a eficácia desses modelos na classificação de discurso de ódio. Os modelos baseados em codificadores mostraram-se mais eficientes quando a dis tância léxica entre os idiomas era mais próxima, alcançando 96,92% na métrica F1-score. Em contraste, os modelos decodificadores mostraram-se mais eficientes quando a distância léxica entre os idiomas era mais distante, alcançando 96,58% na métrica F1-score. Sendo assim, esta dissertação destaca que a diversidade linguística e a consideração da distância léxica em modelos fundamentados em Transformers são cruciais para o desenvolvimento de sistemas eficazes para detectar discurso de ódio. Por fim, os achados desta pesquisa reforçam a viabilidade de utilizar CLL e múltiplos idiomas para aprimorar a detecção de discurso de ódio, oferecendo novas direções e percepções para pesquisas futuras nessa área.