Comparando predição de popularidade de Podcast a partir de metadados, conteúdo e características de áudio

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: MOREIRA JUNIOR, Luiz Delando Santos
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Universidade Federal de Pernambuco
UFPE
Brasil
Programa de Pos Graduacao em Ciencia da Computacao
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://repositorio.ufpe.br/handle/123456789/41534
Resumo: Podcasts são uma forma relativamente nova de conteúdo, que vem ganhando cada vez mais popularidade no cenário nacional e mundial. Por exemplo, a Spotify introduziu os podcasts em seu aplicativo e investiu 340 milhões de dólares na compra de produtoras como a Gimlet e a Anchor. Além disso, em 2019, o grupo Globo lançou diversos dos seus programas e telejornais nesse novo formato, feito para o público ouvir quando e onde quiser. Mas, criar podcasts não é uma particularidade desses grandes grupos. Devido à facilidade no processo de produção e publicação, produtores independentes também ocupam uma fatia desse mercado, fazendo com que exista um grande volume de conteúdo sendo produzido diariamente. Segundo a Whitner, em 2020 foi alcançada a marca de 1 milhão de canais ativos e mais de 30 milhões de episódios publicados. Identificar quais são os podcasts com mais chances de sucesso é uma atividade não trivial é extremamente importante, pois essa informação pode ser usada para modificar a forma com que os episódios são exibidos nos aplicativos ou definir investimentos a serem realizados, por exemplo. O objetivo principal deste trabalho é identificar quais caracerísticas apresentam melhor desempenho na predição da popularidade dos episódios. Para isso, construímos uma base com mais de 800 episódios, totalizando mais de 600 horas de podcasts transcritos. Então, comparamos a predição de popularidade dos podcasts utilizando diversas estratégias de aprendizagem de máquina, bem como características de áudio, do conteúdo falado e dos metadados disponíveis no RSS Feed de cada canal. Estes últimos são utilizados pelos próprios produtores para inserir informações relevantes sobre o podcast.