论文部分内容阅读
近年来,我国互联网信息产业快速发展,基于互联网的社交网络迅速崛起,极大地丰富了人们的日常生活。用户在网络中获取大量的息,然而,面对海量的数据信息,用户无法快速寻找自己感兴趣的信息,面临着信息过载的问题。因此,为解决信息过载难题,基于社交网络的推荐算法应运而生。推荐技术可以根据用户的日常行为以及兴趣爱好,为用户制定个性化推荐,在一定程度上解决了海量数据的推荐问题。然而,由于社交网络的数据稀疏性,传统的协同过滤算法推荐质量不高,冷启动用户无法获得感兴趣信息。针对传统协同过滤推荐算法面临的数据稀疏以及冷启动问题,本文首先引入图结构相似度计算方法SimRank,并根据评分数据信息提出了一种加权的SimRank算法,与经典的Sim Rank算法相比,本文的加权SimRank算法充分考虑了用户对具体项目的偏好程度,有效利用了SimRank算法本身具有的相似传递性,实验结果证明加权SimRank算法相比较于原始SimRank算法推荐指标F1值最高可以提升32%,相比较于传统协同过滤F1值最高可以提升44%,所以本文加权SimRank算法可以在一定程度上缓解用户冷启动问题带来的推荐精度低问题。而且,针对大数据量下算法推荐效率低下情况,本文把改进的加权Sim Rank算法进行MapReduce并行化计算,相比较单机的加权SimRank算法,并行化的算法可以提高推荐的扩展性。其次,针对社交网络中的信任数据信息,本文构建了合理的信任网络模型,通过研究信任的基本特征,采用用户间信任的传递性及有向性等特点来计算信任度,同时文中给出了网络用户之间的评分相似度与信任度线性调和,融入传统协同推荐技术中,取代传统协同相似度计算方法,并实验验证了提出算法的有效性。综上所述,本文将加权Sim Rank算法以及信任网络模型引入到传统协同推荐技术中,充分计算用户间评分相似度以及信任度,实验结果证明了改进的算法能够有效改善传统推荐算法在稀疏数据集上的推荐精度低的问题。