Caracterização autoral interdomínio a partir de textos

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Delmondes Neto, José Pereira
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/100/100131/tde-06092021-142746/
Resumo: Na área de processamento de língua natural, entende-se por caracterização autoral uma tarefa computacional que tem por objetivo extrair informações sociais e psicológicas dos indivíduos, como gênero e faixa etária, por meio de suas produções textuais. Modelos computacionais de caracterização autoral são comumente empregados em áreas como marketing e segurança, dentre outras. Estes modelos geralmente são de domínio único, i.e., são treinados e validados no mesmo gênero textual, o que faz com que sua portabilidade para outros gêneros seja limitada. Em contrapartida aos modelos de domínio único, modelos interdomínio, que são validados em gêneros textuais diferentes dos que foram treinados, podem ser uma alternativa para casos em que não há dados suficientes para o treinamento de um modelo computacional. Um exemplo seria a utilização de dados do Twitter (domínio que dispõem de grande volume de dados) para o desenvolvimento de modelos de caracterização autoral a serem utilizados em e-mails, domínio onde é mais difícil obter um volume de dados suficiente para o treinamento dos modelos. O presente trabalho apresenta uma proposta de pesquisa em nível de mestrado na área de processamento de língua natural, com ênfase em caracterização autoral, com o objetivo geral de desenvolver modelos de aprendizagem de máquina supervisionada baseados em redes neurais artificiais para a tarefa de caracterização autoral interdomínio, de modo a se obter uma alternativa robusta aos modelos de domínio único, com perda de acurácia reduzida se comparada a modelos equivalentes baseados em domínio único