论文部分内容阅读
随着电子商务和Internet的飞速发展,愈来愈多的消费者学会了在网上浏览信息资源,极大的方便了用户。然而随着各种信息资源的选择愈来愈多,人们经常会迷失于繁多的资源空间里面,无法迅速且准确的找到自己所需,借助于个性化推荐系统,这一问题得到了极大的缓解。协同过滤是推荐系统的主流推荐算法,但随着用户物品数目的日益增多和系统规模的不断扩大,许多问题的出现严重导致推荐系统的推荐质量严重下降,如稀疏性问题、Cold-Start问题等等。本文提出了一种基于情感标签的改进的协同过滤推荐算法(Collaborative Filtering Based on Preference Tag,CFBPT),从用户评论数据中自动抽取情感标签,结合情感标签和评分数据共同产生推荐结果,来缓解传统协同过滤推荐算法的稀疏性问题和用户冷启动问题,并对其做了实验分析,结果证明本文的研究成果具有一定的有效性和可行性。本文的主要工作如下:(1)从用户评论中提取情感标签(Preference Tag,PT)。传统的标签的定义是指用来描述信息的关键词,是由专业的研究人员或者用户自动生成标注的文字,呈现自由性。本文提出一种新的标签形式——情感标签,它是来源于用户评论,根据算法自动生成,将其作为数据源运用到改进的CFBPT算法中。(2)针对物品邻居集计算不准确问题,提出了一种改进的综合相似度计算方法。本文将评论挖掘技术引入协同过滤算法中,根据Apriori算法和句法模板等技术抽取特征词和情感词对,量化物品在各个特征上的分数,经过聚类形成一个新的矩阵即物品-特征矩阵,将其结合用户评分共同计算物品相似度。实验证明不仅经过聚类之后,矩阵维度降低,计算量减少,而且通过情感标签的修正相似性值,使得物品邻居集更准确。(3)针对用户-物品评分矩阵存在的稀疏性问题,将得到的物品预测评分填充到用户-物品评分矩阵,结合基于用户的协同过滤思想对用户产生推荐。实验结果表明,改进的CFBPT算法提高了推荐结果的精确度。(4)针对传统协同过滤算法存在的冷启动问题,本文对新用户表达的相关特征偏好构建伪物品-特征向量,寻找与其相似的物品聚类簇。(5)最后构建了个性化推荐系统,对以上改进的算法进行了实验验证,得出结论。