Predição de popularidade em mídia social utilizando uma rede de atenção hierárquica

Detalhes bibliográficos
Ano de defesa: 2019
Autor(a) principal: SANTOS, David Wilson de Farias
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/35365
Resumo: Diariamente, milhares de conteúdos textuais e visuais são compartilhadas entre as pessoas nas redes sociais, entretanto, enquanto alguns conteúdos conseguem engajar vários usuários, outros são totalmente ignorados não alcançando a popularidade que é tão almejada nessas plataformas. Devido a isso, houve um crescimento do interesse dos cientistas de dados na tentativa de entender o que torna alguns conteúdos mais relevantes do que outros. Pois, a compreensão do que torna um conteúdo popular é uma oportunidade sem precedentes para grandes aplicações comerciais, tais como sistemas de recomendação e marketing digital que quer aproveitar ao máximo a atenção do público. Por essas razões o problema de predição de popularidade em mídias sociais tem sido estudado extensivamente ao longo dos últimos anos. Pesquisas anteriores seguem abordagens que atuam sobre dados textuais, visuais e características sociais do perfil. Apesar de alcançarem resultados promissores, os modelos obtidos apresentam pouca capacidade de generalização, devido ao uso de dados direcionados a usuários específicos, dificultando assim a predição de popularidade de novos conteúdos. Portanto, será proposta uma Rede de Atenção Hierárquica Estendida (RAHE) que atende hierarquicamente dados textuais e visuais, levando em conta a influência de um contexto compartilhado entre os usuários de características sociais em comum, representações textuais a nível de caracteres e um método que minimiza os erros obtidos pela predição de popularidade. O objetivo dessa abordagem é tratar os problemas de diversidade e capacidade de generalização encontradas por grande parte dos modelos presentes no estado da arte no problema de predição de popularidade de novos conteúdos. Os experimentos realizados sobre a base de dados Temporal Popularity Image Collection (TPIC) do Flickr demostraram que o modelo RAHE, além de tratar bem a diversidade, apresenta uma alta capacidade de generalização, pois, consegue reduzir significativamente o erro médio quadrático obtido pelo baseline na predição de popularidade de imagens publicadas por novos usuários em 48,14%.