Sumarizador de avaliações usando textrank e modelagem de tópicos

TAKENAKA, Fernando Hideki

Sumarizador de avaliações usando textrank e modelagem de tópicos

Detalhes bibliográficos
Ano de defesa:	2023
Autor(a) principal:	TAKENAKA, Fernando Hideki
Orientador(a):	BALDOCHI JUNIOR, Laércio Augusto
Banca de defesa:	Não Informado pela instituição
Tipo de documento:	Dissertação
Tipo de acesso:	Acesso aberto
Idioma:	por
Instituição de defesa:	Universidade Federal de Itajubá
Programa de Pós-Graduação:	Programa de Pós-Graduação: Mestrado - Ciência e Tecnologia da Computação
Departamento:	IESTI - Instituto de Engenharia de Sistemas e Tecnologia da Informação
País:	Brasil
Palavras-chave em Português:	Processamento de linguagem natural Textrank Modelagem de tópicos Sumarização
Área do conhecimento CNPq:	CNPQ::CIÊNCIAS EXATAS E DA TERRA::CIÊNCIA DA COMPUTAÇÃO
Link de acesso:	https://repositorio.unifei.edu.br/jspui/handle/123456789/3936
Resumo:	Na última década a Internet mudou o modo como as pessoas trabalham, fazem compras e se socializam. Essas mudanças resultaram em um aumento no Conteúdo Gerado pelos Usuários (CGU) como, por exemplo: avaliações, notas, artigos e vídeos. Os CGUs possuem informações relevantes para a tomada de decisão, especialmente no que se refere à aquisição de bens e serviços. Entretanto, o grande volume e dispersão deste conteúdo torna difícil a obtenção de informações relevantes. Neste contexto, a sumarização de textos é apresentada como um modo de tornar este conteúdo mais acessível às pessoas. Um dado sumário A pode ser considerado melhor que um outro sumário B se o primeiro for mais curto que o segundo com o mesmo conteúdo, ou quando mesmo sendo mais longo, possui mais informações relevantes. Analisando a literatura disponível, foi constatado que é possível produzir sumários de melhor qualidade do que aqueles que correspondem ao estado da arte em sumarização de textos. Neste trabalho, apresentamos um sumarizador automático multilingual que combina e expande os algoritmos Latent Dirichlet Allocation (LDA) e TextRank. Em comparação com o estado da arte, este trabalho gerou sumários melhores em termos de tamanho e conteúdo.

Sumarizador de avaliações usando textrank e modelagem de tópicos

Registros relacionados