论文部分内容阅读
在大数据时代,互联网信息量呈爆炸式增长,信息过载问题也越来越严重,给用户带来了困扰。因此,推荐系统应运而生,它可以在一定程度上解决信息过载问题。目前,个性化推荐算法的相关研究已经取得了许多成果,并被应用到了各个领域中。然而由于现实场景中,数据存在着一定的稀疏性,限制了推荐算法的进步与发展。鉴于迁移学习思想的广泛应用,有学者开展了相关研究,提出将迁移学习的思想应用到推荐算法中。现有的结合了迁移学习思想的推荐算法可以缓解数据稀疏问题,使推荐准确度有所提升,但是同时还存在以下问题:不能充分挖掘辅助数据与目标数据间的内在联系、信息迁移不足以及推荐性能1欠佳。针对上述问题,本文开展深入的研究工作,提出了两种基于迁移学习的个性化推荐算法:考虑近邻的迁移共同矩阵分解个性化推荐算法(TCMF-NN)、多源三桥迁移个性化推荐算法(MSTBTR)。在相关真实数据集上进行了实验,结果表明,本文所提出的两个算法比现有算法具有更高的推荐准确度。本文的主要工作如下:1.深入研究现有的个性化推荐算法和结合了迁移学习思想的个性化推荐算法,并对其进行了相应的分析和算法实现,找到其中存在的不足。2.结合了矩阵分解和迁移学习的思想,提出了考虑近邻的迁移共同矩阵分解个性化推荐算法TCMF-NN。现有的迁移共同矩阵分解推荐算法在对用户二进制偏好矩阵和用户评分矩阵进行共同矩阵分解时,忽略了邻居用户的重要性,因此,TCMF-NN算法在进行共同矩阵分解时不只进行了用户的二进制偏好特征和评分特征的迁移,同时考虑到了近邻用户对用户评分的影响,完成了近邻用户的二进制偏好特征和评分特征的迁移,并且将近邻用户的评分特征集成到了用户的评分预测中。与现有的算法相比,该算法能够更深入地挖掘辅助数据与目标数据间的内在联系,使得信息迁移更加充分,提高了推荐准确度。3.提出了辅助数据构造算法BP-ADCA,从原始评分数据中构造二进制偏好辅助数据供迁移推荐算法使用,避免了辅助数据与目标评分数据的关联性不高所造成的推荐性能下降的问题。并将BP-ADCA算法与TCMF-NN算法相结合,提出了改进的迁移共同矩阵分解模型。4.针对现有的结合了迁移学习思想的个性化推荐算法存在的信息迁移不足、推荐性能不高以及大都只利用单一源域知识进行迁移等问题,提出了一种新的多源三桥迁移个性化推荐算法MSTBTR。不同于现有结合了迁移学习思想的推荐算法大都是采用单桥迁移方式或双桥迁移方式,该算法将用户评分模式和物品被评分模式加入到了双桥迁移方式中,并且采用了多个源域数据进行迁移,提出一种多源三桥迁移方式,使得信息迁移更充分,提高了推荐准确度。5.在多个常用的真实推荐数据集上进行了实验,并与现有算法进行了性能对比,验证了本文提出的算法的可行性和有效性。