Detalhes bibliográficos
Ano de defesa: |
2022 |
Autor(a) principal: |
Lan, Alex Gwo Jen |
Orientador(a): |
Não Informado pela instituição |
Banca de defesa: |
Não Informado pela instituição |
Tipo de documento: |
Dissertação
|
Tipo de acesso: |
Acesso aberto |
Idioma: |
por |
Instituição de defesa: |
Biblioteca Digitais de Teses e Dissertações da USP
|
Programa de Pós-Graduação: |
Não Informado pela instituição
|
Departamento: |
Não Informado pela instituição
|
País: |
Não Informado pela instituição
|
Palavras-chave em Português: |
|
Link de acesso: |
https://www.teses.usp.br/teses/disponiveis/100/100131/tde-05052022-094458/
|
Resumo: |
A identificação de valores morais em textos e discursos humanos contribui essencialmente para a compreensão de conflitos sociais motivados pelas diferenças de moralidade, além de comportamentos e posições ideológicas individuais. Em vista disso, muitas são as suas aplicações para a modelagem de problemas e eventos sociais, envolvendo análise de debates políticos, identificação de notícias falsas e a predição de eventos como protestos, campanhas eleitorais, por exemplo. O presente trabalho apresenta um estudo de classificação de categorias morais a partir de textos pautado sobre a Teoria dos Fundamentos Morais (TFM) com a utilização de métodos supervisionados de aprendizado de máquina. Estas categorias consistem em Cuidado, Justiça, Lealdade, Autoridade e Pureza. A tarefa é definida de duas formas sob a perspectiva do Processamento de Língua Natural (PLN). A primeira delas trata da classificação de fundamentos morais impessoais (CFMI), que é abordada de maneira similar às tarefas de análise de sentimentos, no sentido de que os fundamentos são referentes apenas ao significado expresso no texto. Por outro lado, a tarefa de classificação de fundamentos morais pessoais (CFMP), que é essencialmente inexplorada na literatura, define-se como uma instância de caracterização autoral, ou seja, considera a moralidade do autor do texto analisado, permitindo assim a captura de informação de classe não necessariamente explícita. Os trabalhos existentes são baseados em formas de representação textual mais tradicionais como Bag-Of-Words e word embeddings estáticos. Como forma de avançar o estado-da-arte nesses dois tipos de problema, este estudo propõe o desenvolvimento de modelos baseados em métodos de embeddings sensíveis ao contexto para as tarefas de CFMI e CFMP. De forma específica, foram conduzidos experimentos com estas duas tarefas nos idiomas em inglês, para CFMI, e português brasileiro, para CFMP, utilizando modelos como ELMo e BERT. Os resultados sugerem a eficácia no uso desses embeddings sensíveis ao contexto em CFMI e o potencial dos modelos de CFMP baseados em métodos como regressão logística com n-gramas de caracteres. Com isso, deixam-se oportunidades de futuros estudos na área, especialmente para PLN em português brasileiro |