论文部分内容阅读
随着数据信息的不断快速增长,出现了信息过载现象。为了有效缓解信息过载问题,研究者提出了个性化推荐的概念并进行了深入的研究和大量的实际应用,取得了很好的经济效益。协同过滤推荐技术作为个性化推荐的一个重要分支,是当前应用最为广泛、成功的一种个性化推荐技术。协同过滤算法可以分为基于项目的协同过滤、基于用户的协同过滤和基于模型的协同过滤,其中,基于模型的协同过滤是目前最为主流的协同过滤类型。而其中的概率矩阵分解模型因其具有编程易于实现和推荐精度高等优点,被大量应用在协同过滤推荐算法中。但是,基础的概率矩阵分解模型存在冷启动问题,研究发现,将用户社会关系融合到概率矩阵分解推荐的过程中能够在一定程度上缓解传统推荐系统中的冷启动问题。在实际推荐环境中,用户之间的社会关系很难获取。在构建用户社会关系时需要考虑数据稀疏性问题,传统的相似度计算方法主要通过用户共同评分项目去计算最终的用户间相似度,共同评分项目越多,计算得到的相似度越准确。当存在数据稀疏性问题时,用户之间的共同评分项目很少,这会在一定程度上降低相似性计算结果的准确性。针对用户社会关系难以获取问题,本文提出利用用户相似度和信任因子去构建一种基于潜在兴趣和信任的用户社会关系。针对相似度计算时存在的数据稀疏性问题,本文提出了融合EMD距离与用户兴趣的混合相似度算法。本文具体工作如下:第一,提出了一种融合EMD距离与用户兴趣的混合相似度算法(I-EMD)针对数据稀疏性问题,首先,EMD方法用线性规划的思想将用户对所有项目的评分数据全部加入到相似度的计算过程中,改变了传统方法中只依靠用户共同评分项目去计算相似度,计算得到用户之间的EMD相似度。然后,利用用户兴趣度,可以挖掘用户对每一个项目属性的偏好,从而构建出用户对项目属性的稀疏性较小的用户兴趣元素矩阵,通过用户兴趣元素矩阵计算得到用户之间的兴趣相似度。最后,用权值α将两个相似度值结合起来,得到用户之间的融合EMD距离与用户兴趣的综合相似度。通过对比实验发现:I-EMD混合相似度的协同过滤推荐算法的平均绝对误差(MAE)值和p@10值均优于传统的基于余弦相似度的协同过滤推荐算法。第二,提出了融合相似度和信任度的PMF推荐算法(ST-PMF CF)针对用户社会关系难以获取的问题,本文提出利用用户之间的相似度和信任度去构建用户之间的基于潜在兴趣和信任的社会关系,相似度计算过程中使用I-EMD混合相似度算法。最后,将用户间的社会关系加入到概率矩阵分解(PMF)模型中完成推荐。通过与传统的协同过滤算法和基于概率矩阵分解的推荐算法进行实验对比,ST-PMF CF的平均绝对误差(MAE)值和P@10值优于前两者。