论文部分内容阅读
推荐系统中的评分预测功能是指通过已知的用户历史评分记录来预测未知的用户评分值,它可以广泛应用在电子商务、旅游、社交等领域,具有非常可观的应用前景和研究价值。但是,现有的评分预测模型面临着缺少标注评分数据、长尾分布等问题,导致预测精度低下,难以满足推荐系统发展的需要。因此,提高评分预测性能、保障预测精度,是现今评分预测模型研究的当务之急。本文基于深度学习和机器学习技术,通过利用表示学习改进协同过滤、对全域项目特征进行鲁棒性预测、融合社交信任和稀疏编码器模型的预测以及利用评分知识的迁移实现跨域预测等方面进行了深入研究。首先,针对协同过滤算法面临的数据稀疏以及难以提取交互评分信息的问题,提出了基于实体共现深度表征学习的协同过滤评分预测方法以及融合全局化和局域化评分深度表征学习的协同过滤评分预测方法。基于自然语言处理中词共现原理,分别从实体共现和实体评分两个角度提取交互评分的语义信息;并通过对实体及评分共现矩阵的分解来表示其嵌入特征,最后利用最小二乘法建立神经网络训练模型,从而刻画和预测用户评分值。其次,针对现有评分预测方法自身的局部性缺陷以及弱鲁棒性问题,提出了一种基于鲁棒性约束的全域项目评分预测方法。数据样本中的异常点对评分预测性能有着重要的影响,该方法首先提出一种鲁棒性约束策略来剔除评分样本中的异常噪点,避免异常因子对预测结果带来的偏差性影响。根据项目间的差异化特征,提出项目差异权重和补偿系数来改进评分基准预测器,从而更好地学习项目特征和用户偏好,做出最终预测。再次,针对传统评分预测模型推荐方式单一以及预测准确率不高的问题,提出了一种基于社交信任嵌套和深度编码学习的评分预测方法。通过挖掘和提取用户社交信任邻居的评分信息,获取多源评分数据来刻画用户偏好,并将其融入和嵌套到矩阵分解模型中。基于获取到的多源评分数据,将正则化和稀疏化约束项添加到构建的深度稀疏编码模型中,进而实现评分预测结果。然后,针对评分预测系统内在的数据稀疏以及跨域预测系统存在的异质性问题,提出了一种基于部分重叠实体潜在特征迁移的跨域评分预测方法。该方法通过跨域矩阵分解来提取实体潜在特征,并利用对抗网络原理来对齐源域和目标域中的用户实体潜在特征。基于对齐后的用户特征,调整并对齐跨域间的项目特征。另外,设计了一种N步跨域随机游走算法,从而构建跨域用户关系图,并计算跨域用户相似度。依据获取到的相似度,提出了基于相似度约束的跨域评分预测模型。最后,为了评价本文提出的评分预测方法的性能,在Epinions和Movie Lens 25M数据集上进行多种评分预测模型的对比实验,并通过平均绝对误差、均方根误差、准确率、召回率以及收敛性等指标进行比较和分析。