基于标签的个性化推荐系统的研究与实现

来源 :北京工业大学 | 被引量 : 7次 | 上传用户:xia__1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务和Internet的飞速发展,愈来愈多的消费者学会了在网上浏览信息资源,极大的方便了用户。然而随着各种信息资源的选择愈来愈多,人们经常会迷失于繁多的资源空间里面,无法迅速且准确的找到自己所需,借助于个性化推荐系统,这一问题得到了极大的缓解。协同过滤是推荐系统的主流推荐算法,但随着用户物品数目的日益增多和系统规模的不断扩大,许多问题的出现严重导致推荐系统的推荐质量严重下降,如稀疏性问题、Cold-Start问题等等。本文提出了一种基于情感标签的改进的协同过滤推荐算法(Collaborative Filtering Based on Preference Tag,CFBPT),从用户评论数据中自动抽取情感标签,结合情感标签和评分数据共同产生推荐结果,来缓解传统协同过滤推荐算法的稀疏性问题和用户冷启动问题,并对其做了实验分析,结果证明本文的研究成果具有一定的有效性和可行性。本文的主要工作如下:(1)从用户评论中提取情感标签(Preference Tag,PT)。传统的标签的定义是指用来描述信息的关键词,是由专业的研究人员或者用户自动生成标注的文字,呈现自由性。本文提出一种新的标签形式——情感标签,它是来源于用户评论,根据算法自动生成,将其作为数据源运用到改进的CFBPT算法中。(2)针对物品邻居集计算不准确问题,提出了一种改进的综合相似度计算方法。本文将评论挖掘技术引入协同过滤算法中,根据Apriori算法和句法模板等技术抽取特征词和情感词对,量化物品在各个特征上的分数,经过聚类形成一个新的矩阵即物品-特征矩阵,将其结合用户评分共同计算物品相似度。实验证明不仅经过聚类之后,矩阵维度降低,计算量减少,而且通过情感标签的修正相似性值,使得物品邻居集更准确。(3)针对用户-物品评分矩阵存在的稀疏性问题,将得到的物品预测评分填充到用户-物品评分矩阵,结合基于用户的协同过滤思想对用户产生推荐。实验结果表明,改进的CFBPT算法提高了推荐结果的精确度。(4)针对传统协同过滤算法存在的冷启动问题,本文对新用户表达的相关特征偏好构建伪物品-特征向量,寻找与其相似的物品聚类簇。(5)最后构建了个性化推荐系统,对以上改进的算法进行了实验验证,得出结论。
其他文献
近几年,基于内容的体育视频分析越来越受到人们的关注,研究者在结构化分析和语义检测方面展开了大量的工作,但是这些工作有一个很大的局限性:引入太多的领域知识,通常只能在一种或
自1995年问世以来,Java语言因为其安全、跨平台、面向对象等优秀特性而受到人们的欢迎,在各个行业当中都得到了广泛的应用。作为Java程序所运行的基础平台,Java虚拟机的性能直接
随着社会的不断发展,信息技术扮演着越来越重要的角色,有更多的关键业务依赖于计算机系统提供的服务。如何提高计算机系统对灾难的抵抗,保证服务的持续运行和快速恢复是一个极具
可视化将数据信息转化为一种视觉形式,充分利用人们对可视模式快速识别的自然能力,使我们能够极其有效的发现隐藏在信息内部的特征和规律。随着传感器性能的提高,卫星图像向高分
近年来,业务流程的广泛使用极大的提高了企业的生产效率,增加了企业的竞争力。但随着社会的不断发展,企业的业务目标也在不断调整,对业务流程的柔性调整的要求也越来越高。目前BP
目前,企业级数据中心利用虚拟化技术来进行服务整合已经变得越来越普遍。随着网络应用需求规模的日益增加,虚拟的网络服务器集群作为一种可靠和先进的资源系统已经广泛出现,成为
空间科学实验的成功离不开大量地基实验的支持,每一个载荷的研制不仅价格昂贵而且耗时周期漫长,载荷之间的对接一旦出现意外,可能同时殃及多台设备,后果不堪设想。为了保证设
以移动IPv6为基础的移动互联网是未来网络的发展方向,移动互联网采取无线接入方式,使得无处不在的网络接入成为可能。无线移动网络因其具有支持漫游、使用简单、部署灵活、易于
网络流量分析是网络研究中的重要方面,它对于流量建模、流量产生、网络性能评价、互联网应用研究等各个方面都具有重要意义。随着目前互联网应用的不断丰富,针对不同应用层协议
POI(Point of Interest)搜索(用户兴趣点搜索)就是在互联网环境中搜索含有用户感兴趣的位置信息的技术,相对互联网的其他搜索技术而言,POI搜索是本地搜索。随着位置服务技术的