Ranqueamento Personalizado Baseado em Dados Enriquecidos: Uma Abordagem de Co-Treinamento

Detalhes bibliográficos
Ano de defesa: 2021
Autor(a) principal: Mine, Marcelo Miky
Orientador(a): Não Informado pela instituição
Banca de defesa: Não Informado pela instituição
Tipo de documento: Dissertação
Tipo de acesso: Acesso aberto
Idioma: por
Instituição de defesa: Biblioteca Digitais de Teses e Dissertações da USP
Programa de Pós-Graduação: Não Informado pela instituição
Departamento: Não Informado pela instituição
País: Não Informado pela instituição
Palavras-chave em Português:
Link de acesso: https://www.teses.usp.br/teses/disponiveis/55/55134/tde-23062021-112356/
Resumo: A crescente oferta de produtos, serviços e informações na Web tem levado diversas aplicações a utilizar e desenvolver sistemas de recomendação para sugerir conteúdos de acordo com as preferências de cada usuário específico. Nesses sistemas, uma grande quantidade de dados rotulados deve estar disponível para obter boas previsões. No entanto, os dados rotulados são frequentemente limitados e caros de se obter, uma vez que a rotulagem geralmente requer tempo e conhecimento humano. Além disso, geralmente, os usuários estão interessados apenas nas recomendações com melhores posições, enquanto as sugestões com posições inferiores são ignoradas. Como faltam métodos que promovam o enriquecimento (rotulagem) com classificação, este trabalho propõe uma técnica que recomenda os top-n itens com base em dados enriquecidos. O enriquecimento é baseado em um método de co-treinamento, cuja aprendizagem usa múltiplas visualizações - dados divididos em dois subconjuntos separados - para diminuir a esparsidade dos dados. A escolha dos itens no enriquecimento é baseada em uma métrica de confiança, que busca itens mais relevantes para usuário. Então, esses dois subconjuntos enriquecidos são combinados com um método de ensemble. Na avaliação, utilizamos conjuntos de dados reais de domínios distintos e os experimentos mostram que o método proposto atinge melhores resultados, em comparação com o baseline, quando um algoritmo de recomendação é usado nestes dados enriquecidos combinados.