论文部分内容阅读
协同过滤推荐算法可帮助用户发现新鲜事物并提供个性化推荐,吸引了很多学者、专家对其计算模型、计算方式进行改进和拓展,以提高推荐精度。随着人们需求质量的提高和数据量的增大,协同过滤推荐算法模型显得比较粗糙、得到的近邻集合也不够准确。在分析用户行为和相关数据的基础上,针对其缺陷提出一系列改进措施,经过实验验证改进后的协同过滤推荐算法的推荐性能得到很大改善。本文主要工作如下:1、针对传统协同过滤推荐算法存在推荐模型比较粗糙、推荐精度不断下降和数据稀疏产生的严重影响。从用户对项目的评分和用户属性等方面考虑,本文提出多因素协同过滤推荐算法,利用参数将用户评分因素和用户属性因素相融合,并通过实验验证了多因素协同过滤推荐算法的优越性和数据稀疏情况下算法的性能。2、在用户评分因素方面,利用用户评分差值计算模型计算用户之间的相似度,并对评分差值计算公式进行改进,完善公式在用户存在的个性化特点上不适用、不合理的问题。另外,公式还存在无法区分模糊用户和极易丢失极度相似的用户,本文通过对公式的处理,拉大模糊区间使模糊用户明显分开,引入用户评分最大差值变量,去掉影响因素,解决了极度相似用户损失等问题。3、在用户属性方面,挖掘出用户行为属性,增加用户的信息量,分析传统用户属性相似度计算公式忽略的不同属性对用户有不同程度的影响,提出量化属性相似度计算方法,通过用户对项目的评分来确定相似用户,再用相似用户表达出量化用户属性的计算方式,由训练数据集最终确定属性的量化值,用量化属性公式计算量化用户属性的相似度。4、最后针对传统协同过滤推荐算法对用户隐式反馈数据挖掘不够充分,提出一种标签重要程度的协同过滤推荐算法。用户使用标签的种类和频率可以反映用户的偏好和偏好程度,在此基础上建立新的用户兴趣偏好模型,计算标签的平均重要程度,针对不同用户利用文本逆频率文件计算标签的重要性参数,最后获得目标用户的近邻集合和预测评分,为目标用户实施有效推荐。实验结果表明该算法大幅度提高了推荐的精准度、缓解了冷启动问题。