论文部分内容阅读
目的——推荐系统作为解决信息超载问题的一种有效方法,能够帮助用户快速寻找可能感兴趣的资源。但传统推荐系统中仍然存在一些问题,例如评分矩阵数据稀疏、用户兴趣偏好转移和冷启动等问题。标签信息由于兼具资源描述信息和用户兴趣偏好信息,与其相关的应用也越来越广泛。除了可以用于电影、图书等常规资源的推荐,还可以用于网络社交的推荐。这为传统推荐系统带来新的转机,但是标签信息的使用也带来了新的问题,例如如何从标签中提取有效信息。为此在传统的协同过滤算法中融入标签和时间信息。以标签的形式增强用户与资源之间的联系;以时间的形式增强推荐与用户兴趣偏好之间的联系。方法——首先,根据标签所反映的资源描述信息和用户兴趣偏好信息将其划分为标准化标签和社会化标签,并对标签相似度计算公式做出改进。其次,在传统协同过滤的基础上引入标签信息。使用改进后的标签相似度计算公式进行第一次评分值预测,并将评分预测值填充于原始评分矩阵;在填充后的矩阵上进行基于用户的最近邻推荐,得到最终的推荐结果。最后,针对用户兴趣转移问题对融合标签信息的协同过滤算法做出进一步地改进。对用户的评分和标注行为加入相应的时间权重因子,以此降低时间间隔较长的评分和标注行为在相似度计算时的影响权重,从而使得推荐结果能更加符合用户的兴趣变化。研究结果——首先,对社会化标签进行预处理,根据使用的频繁性选出真正有区分价值的社会化标签用于后续计算。并通过两种标签信息的调节因子取值进行比对实验来确定其合适取值,使得基于标签相似度的计算结果更加准确;其次,将标签信息和协同过滤推荐算法进行融合。通过与传统协同过滤和基于标签推荐的算法比对实验,来验证融合标签信息的协同过滤改进算法的可行性;最后,引入时间信息进行不同遗忘速度取值比对实验来确定其合适取值,并通过与融合标签信息的协同过滤算法的比对实验来验证基于时间信息改进算法的可行性。研究的局限性——仅根据使用的频繁性来选择具有区分价值的社会化标签。但社会化标签是用户凭借自由意志使用,且没有规范的词汇和层次结构的限制。因此可能存在一词多义和同义词等现象,导致社会化标签中隐含的信息不能很好地被理解。此外,该算法在分类的效率和准确度上也有待进一步提升。实际影响——通过融合标签信息的协同过滤算法,使用标签来加强用户和资源之间的联系,提高推荐的准确度。并通过引入时间权重因子来把握用户兴趣的转移,为用户提供更加有效地推荐,提高用户与系统的黏着性。独创性——将标签划分为标准化标签和社会化标签,针对两种标签所反映的不同信息提出基于标签信息相似度计算的改进公式;融合标签信息和时间信息对传统协同过滤方法进行算法改进,使得推荐结果更加符合实际情况,并能在一定程度缓解数据稀疏、用户兴趣转移等问题。