Estudos sobre um modelo de representação distribuída de palavras no contexto de análise de estados emocionais

Detalhes bibliográficos
Ano de defesa: 2018
Autor(a) principal: Silva, Isabela Ruiz Roque da lattes
Orientador(a): Silva, Leandro Nunes de Castro lattes
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Presbiteriana Mackenzie
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Área do conhecimento CNPq:
Link de acesso: http://dspace.mackenzie.br/handle/10899/24480
Resumo: Emoções são importantes nas relações interpessoais e fazem parte do ser humano. Muitas pessoas podem expressar seus sentimentos ou emoções nas mídias sociais, como no Twitter e no Facebook. Muitas técnicas computacionais foram propostas para o estudo das emoções e a maior parte delas utiliza uma representação baseada em conjuntos de palavras (bag of words) para os documentos. Recentemente, novas abordagens, como o Word2Vec, capazes de gerar representações distribuídas de palavras, chamadas de vetores de palavras ou word vectors, surgiram e vêm sendo empregadas para o estudo sintático e semântico de documentos. Para contribuir com a pesquisa nas áreas de análise de estados emocionais a partir de dados de mídias sociais e numa melhor compreensão sobre o uso de modelos de representação distribuída de palavras, essa dissertação propõe investigar três hipóteses de pesquisa: os parâmetros do Word2Vec influenciam as representações distribuídas das palavras e, consequentemente, o desempenho dos classificadores de estados emocionais que usam essas representações; as representações distribuídas de palavras podem melhorar o desempenho de classificadores convencionais aplicados ao estudo de estados emocionais; e o agrupamento dos vetores de palavras geram grupos que carregam o contexto semântico dos estados emocionais. Os experimentos realizados mostraram pouca influência dos parâmetros do algoritmo no seu desempenho para esse problema específico. Também observamos que os vetores de palavras não podem ser aplicados diretamente no treinamento dos classificadores e o vetor resultante deteriorou muito o desempenho dos classificadores quando comparado ao modelo tradicional do tipo bag of words. Por fim, verificamos que o agrupamento dos vetores de palavras, embora gere grupos com significado semântico claro, não gera os grupos que refletem os estados emocionais.