基于社交网络信息的协同过滤推荐算法研究

来源 :浙江师范大学 | 被引量 : 0次 | 上传用户:zel0088
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着网络技术的日益成熟,越来越多的互联网公司应运而生,以FaceBook、LinkedIn、腾讯等为代表的社交网站也纷纷出现,这些网站为人们提供一个学习、交流、娱乐的平台,极大地丰富了人们的生活,对人们的生活方式也有着重要影响。然而这些网站大都拥有庞大的用户量和海量的数据信息,海量的数据信息为互联网用户带来方便的同时,也给推荐系统带来了技术性的挑战。协同过滤作为最流行的推荐方法之一,由于其良好的可实现性和扩展性,在推荐领域被广泛地应用。其中用户对项目评价数据对传统的协同过滤算法起着关键性作用,然而在大数据时代的背景下,面对海量的数据信息,用户很难对自己喜欢的项目全部进行评价,这就造成了评价数据的稀疏,从而影响推荐算法的精度性。如何充分地利用丰富的社交网络信息,合理地建立推荐模型以提高推荐精度,已成为一个比较热门的研究方向。针对协同过滤算法中存在的问题,本文主要研究工作及成果具体如下:第一,从不同角度分析社交网络信息特征,并对协同过滤算法的算法思想、实现步骤、优缺点等进行研究,从协同过滤算法存在的问题出发,然后充分利用社交网络信息,对算法进行改进。第二,从多个方面分析影响算法的因素,对协同过滤算法中相似度模型进行研究,提出一种基于社交网络信息的协同过滤算法。用户(项目)相似度模型在协同过滤中起着关键性作用,由于数据稀疏,单一地利用评价数据计算的相似度模型对于推荐精度不能有很好地提高。针对上述问题,本文利用社交网络信息分别从用户的标注信息、标签信息、社交关系三个方面分别建立用户相似度模型,然后采用协同过滤算法进行融合。第三,对协同过滤算法中最近邻进行研究。传统的协同过滤算法都依赖于其最近邻,最近邻的精确程度,对推荐精度有着重要影响,然而最近邻的获取又常常依赖相似度模型。本文对社交网络信息以及算法中最近邻的研究,提出一种改进最近邻的协同过滤算法,该算法在寻找用户和项目最近邻时,主要从评价数据、用户社交活动信息,项目文本信息,来建立用户和项目的相似度,获取其相应的最近邻,然后将获得的四种最近邻进行组合改进,生成去噪最近邻与补充最近邻,最后利用这两个改进最近邻结合传统的协同过滤算法进行推荐。在KDD CUP 2012 Track1数据集上进行实验,实验表明,本文提出的两种算法对数据稀疏问题有较好的缓解作用,相比传统的协同过滤算法,推荐精度有较好的提高。
其他文献
对于零散的低渗透区块、小规模油田,同井采注水是保持合理油藏压力、维持油田长期高产稳产的有效、易行的方法。所谓同井采注水技术,就是在注水井内,选择油层段以上的水层作
本文在了解肇州油田州十三区块的区域地质沉积背景,明确其构造特征的基础上,对其按照沉积相特点进行了油层组内小层细分和命名。并对储层岩石性质、储层物理性质进行了阐述。
萨中东部过渡带属河流三角洲沉积的多油层砂岩油田,过渡带储层是以粉砂岩、泥质粉砂岩、粉砂质泥岩和含钙粉砂岩沉积,油层发育比较复杂,孔隙度、渗透率、含油饱和度低,非均质
南一区萨葡油层经过一次、二次加密调整后,阶段上取得了较好的开发效果,但随着进入特高含水期开发阶段,又出现了一些影响开发效果及生产的不利因素,主要表现在部分区域、部分
目前,松辽盆地中央坳陷区大庆长垣萨尔图油田开发已进入特高含水期,水驱、聚合物驱、化学驱等多种驱油方式并存。西区萨葡油层水驱井网共有油水井187 口,葡一组聚合物驱井网
近年来,随着智能手机的逐渐普及和功能的愈发强大,悄然改变着人们的生活方式,让我们的生活更加智能化、信息化。然而,我们还要为携带不同银行的信用卡、酒店房卡、公司进出的
自从波特兰水泥问世以来,钢筋混凝土结构已经成为港口建设工程中最为常用的建筑形式之一。一百多年来,人们一直在研究对混凝土结构检测的技术,以期掌握混凝土结构在各种复杂
CO2-EOR是一种高效的提高油田采收率技术,可将CO2埋存减排与驱油相结合,具有广泛应用前景。高压密相CO2输送是CO2-EOR的一种CO2输送方式。输送过程中,CO2处于高压密相状态,若
市场经济是伴随着资本主义逐步发展起来的,一方面它通过公开公平的竞争方式激励人们各尽所能,极大地增进了社会财富的积累,另一方面却自发、盲目、遵循优胜劣汰,造成贫富对立
当前高强钢结构的研究对象主要是针对高强钢组合偏心支撑框架进行的,而对抗弯钢框架性能的研究不足。在强烈地震作用下抗弯钢框架的合理机制为“强柱弱梁”,该机制并不是仅仅