基于数据流挖掘的推荐系统研究

被引量 : 0次 | 上传用户:aierlansi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展,越来越多的人会选择在网上进行购物、查看新闻、看电影等等,但是名目繁多的选项会让人不知如何选择,由此出现了所谓的“信息过载”现象。所以,对过多的信息进行筛选是很有必要的,可以改善用户的上网体验,快速地定位找到用户所需的信息,由此推荐系统应运而生。同时,随着大数据时代的到来,越来越多的数据会以流的形式出现,但对数据流的利用率并不是很高,于是本文提出了将数据流分析与推荐系统相结合的想法,以实现更加个性化的推荐方案。本文立足于对数据流中的点击流数据进行研究分析,在此基础上从两个方面研究推荐方法。首先,在MapReduce并行计算框架下研究频繁项集的挖掘,提出了一种新的基于二叉树的并行频繁项集挖掘算法(以下简称为FIMB算法),利用一次Map/Reduce过程即可完成挖掘,不需要进行迭代计算,充分应用了集群的并行性,并根据挖掘结果进行关联推荐。其次,本文提出了一种在社交网络中基于信任的推荐系统模型,该模型的主要思想是代理在社交网络中取得所需信息,并通过这些信息之间的信任关系来进行信息过滤;研究中还发现网络的密度、代理之间偏好的各异性和知识的稀疏性都是影响系统性能的至关重要的因素。最后,本文将点击流数据分析与两种推荐模型相结合,提出了一种基于点击流的推荐系统框架模型,并用流程图的形式给出了系统框架,同时列举了几种准则来评估推荐系统的推荐效果。本文通过实验对比的方式证明了FIMB算法的效率高于CD和DD两种并行算法,并采用数学公式的计算方法来近似分析了社交网络中基于信任的推荐效果,具有一定的研究价值和创新性。
其他文献
<正>我的孩子在和同伴发生矛盾的时候总认为都是别人的错,没想过自己的问题。如果我让他多反思自己是否有不对的地方他就很生气。我觉得自己总说不到他心里去。请问如何有效
期刊
在分析气象档案特点与来源的基础上,归纳了各类气象档案归档整理的方法,指出了目前基层气象档案管理中存在的薄弱环节,提出了提高基层气象档案管理质量的对策。做好基层台站气象
在竞争日益激烈的商品市场中,供应链作为一个情况复杂的动态系统,既有上游的供应商、制造商等,还有下游的销售商、零售商等。而供应链成员大多都只追求各自利益的最优,进而使
中国石化北京燕山分公司新建碳五分离装置采用中石化自主知识产权技术建成,以燕山石化乙烯装置副产碳五馏份为原料,设计负荷15万吨/年,主要产品为异戊二烯、间戊二烯和双环戊
<正>多数包装食品都标明保质期和保存期。保质期,指预示在任何标签上规定的条件下保持食品质量的期限,在此期限食品完全适用于销售。超过此期限,食品仍然可能是可以食用的。
由于我国目前在高中阶段同时并行四版本教材,而青海省在初中阶段地理科目不参加中考,所以所有学校在初中阶段普遍不重视地理,加之地理课程在初中阶段主要安排在初一初二,学生
随着老龄化现象的到来,医疗、卫生、生活水平的提升,我国老龄化人口急剧增长,老龄化进程逐步加快。由老龄人口增长带来的冲击引发了一系列问题,影响到社会、经济、文化等各个
放眼当今世界,随着中国的崛起,世界各国已兴起一股学习汉语的风潮。在英语已然成为各国学习者学习汉语的桥梁和媒介的大背景下,本文通过各种对比,遴选出两种有代表性的、经典