论文部分内容阅读
身处移动互联网时代,用户获取信息的渠道与日俱增,因此很难迅速对内容做出有效判断。信息过载等问题的出现使得推荐系统应运而生,并在各个领域展开了丰富的运用。但是,推荐系统面临的数据稀疏、冷启动等问题依然难以被有效地解决。因此,越来越多的机器学习技术开始运用于改进推荐算法。迁移学习技术能够通过迁移其他领域的知识至目标领域,为推荐结果增加可学习数据、强化推荐模型,缓解目标领域的数据稀疏和冷启动问题。因而本文开展了基于知识迁移的跨领域推荐模型和算法的研究,完成的主要工作如下:(1)大多数跨领域推荐算法常采用迁移学习技术,然而现有的迁移学习方法大多基于单一的评分模式迁移,在领域不相关的场景下,往往会导致负迁移、推荐结果不佳等问题。本文将评分知识与行为知识相结合,共同辅助目标领域的学习任务。在行为数据中,项目标签与用户的真实偏好相关,能够从另一个侧面反映用户或项目的隐式特征。为了缓解负迁移,考虑将辅助领域和目标领域的标签进行聚合,共同获得可迁移的知识。在此基础上,提出了融合标签的跨领域迁移推荐算法ITTCF(Item-based Tag Transfer Collaborative Filtering)。算法摒弃了仅对评分模式进行迁移的单一辅助方式,结合了用户评分和项目标签这两种异构知识,并融合了目标领域的标签,在一定程度上改善了目标领域数据的稀疏性和负迁移问题。(2)在现实场景中,用户更关心的是推荐的结果而不是评分,通过预测评分进行推荐并不能准确地捕获用户的偏好。基于此,进一步提出了面向对级排序的知识迁移推荐算法 RBT(Ranking-oriented Behavioral knowledge Transfer recommendation)。将算法的推荐目标从评分预测转向排名预测。通过迁移包括评分、标签在内的领域信息,得到更多的项目偏好,从而能够构建更为丰富的项目偏序对,用以训练排序模型,最终为目标用户生成候选推荐列表。(3)选取了豆瓣电影、豆瓣图书、MovieLens等数据集开展上述算法的对比实验。实验结果表明,ITTCF在RMSE和MAE上较对比算法分别提升了 1.61%-6.67%和1.97%-8.83%。通过排序学习,RBT在准确率、召回率、NDCG等面向排序的推荐评价指标上也均得到提升。