论文部分内容阅读
大众标注(Folksonomy)的概念随着Web2.0技术的发展出现,它重视用户参与,通过邀请用户参与标注过程,可以达到知识共享和用户交互的目的,能挖掘用户标注中潜在的偏好。凭借自发性和低约束性,大众标注得以飞速发展。当前,使用传统分类法构建的网站上应用了很多比较成熟的推荐机制,例如基于协同过滤的推荐机制等,然而随着大众标注的发展,使用新的用户-标签-项目三元模式进行信息构建的网站越来越多,原有的推荐机制将不足以更好地挖掘出标签中用户的潜在偏好,基于大众标注的推荐机制研究在近年来逐渐成为热门课题。本文在学习几种传统推荐机制的基础上,对基于协同过滤的推荐机制进行改进后,设计了一种新型的基于Folksonomy和HOSVD的个性化推荐机制PRS(Personal Recommendation System),其中HOSVD (Higher Order SingularValue Decomposition)是指高阶奇异值分解算法,本文引入HOSVD是要用它来缓解三元数据的稀疏性问题。本文的重点研究内容有:(1)使用HOSVD算法处理大众标注的三元数据。当前比较成熟的推荐机制中,基于协同过滤技术的推荐机制得到了最广泛的应用,如淘宝,youku,当当网等各种类型的网站中,它都得到了不错的发展。基于协同过滤技术的推荐机制处理的数据是用户对项目进行评分所构成的三元数据,这是一种简单的大众标注模式,由于用户评分过的项目数量远远小于项目实际数量,所以基于协同过滤技术的推荐机制面临很严重的数据稀疏性问题,一定程度上制约了它的发展。基于大众标注的推荐机制需要处理用户使用标签对项目进行标注而生成的三元数据,它比评分模式更复杂,将会面临更加严重的稀疏性问题,所以本文引入了HOSVD算法,可以在尽可能地保证原有数据关联的前提下填补空缺数据,从而有效降低数据冗余,提高推荐机制的效率和精度。(2)改进传统推荐机制,设计一个新的个性化推荐机制PRS。由于信息构建模式的不同,使用大众标注技术进行信息构建的网站可以体现更多的用户潜在偏好,而直接应用传统推荐机制,却不足以充分挖掘这些偏好,也不能有效地生成更贴近用户期望的推荐结果。本文在学习几种经典的传统推荐机制的同时,充分考虑大众标注的三元数据的特性,设计了PRS推荐机制。PRS主要考虑用户对标签的潜在偏好和项目中标签的潜在偏好,用户对标签的潜在偏好可以体现用户的期望,有助于生成个性化的推荐结果,项目对标签的潜在偏好则可以更准确的定位项目的性质,使得推荐结果更准确。同时计算标签相似度和项目相似度,并把这两种相似度与用户对标签的潜在偏好和项目中标签的潜在偏好结合起来,得出用户检索时每个项目的个性化推荐得分PRV(Personalized recommendationvalue),根据PRV降序排列所有项目即可得出PRS的推荐结果。(3)使用网上的大众标注数据包进行仿真实验,通过对比PRS与几种传统推荐机制的推荐效果和运算时间,检验PRS的性能和实用性。