在线旅游网站关联推荐方法的研究

被引量 : 0次 | 上传用户:SQUIRRELXX
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
关联规则是互联网数据挖掘极其热门的研究方向。由于运用关联规则挖掘算法可以发现商品之间的潜在关联,推荐给用户之后,可以到达提高销量以及提升用户体验的良好效果。本文主要研究关联规则算法在网站推荐方面的应用,通过提出并构建了一个基于分块思想的推荐模型,应用于在线旅游网站,致力达到向在线旅游网站用户推荐优质的旅行目的地团购商品的目标。本文研究的主要内容和成果:(1)概述了数据挖掘以及关联规则挖掘算法的相关技术,并对比了Apriori算法与FP-tree算法在挖掘方面的优缺点,发现FP-tree算法虽然在算法效率上优于Apriori算法,但是其树结构极其占用内存,面对海量数据时有可能导致算法无法执行完成。(2)为了克服经典Apriori算法挖掘极其耗费时间的弊端,本文在介绍了Apriori算法并行化处理的技术基础上,给出了基于MapReduce的Apriori并行算法。并行化的Apriori算法通过分割处理的方式,既保障了其最终挖掘结果的一致性,还在时间上和空间上均节约了开销。(3)基于在线旅游网站的推荐背景应用下,本文提出了一个在线旅游网站的关联规则推荐模型。该模型结合实际情况,利用商圈标签作为分割,将庞大的事务数据很好地划分为多个数据块,并对其进行基于MapReduce的Apriori并行算法。挖掘产生的关联规则保存于关联规则库,当触发推荐事件时,直接从关联规则库中取出,此方法规避了每次都挖掘所产生的服务器开销,同时还提升了用户体验。(4)本文通过搭建基于Hadoop的仿真平台进行了实验。通过对样本数据的挖掘,印证了并行化的Apriori算法在面对海量数据时相较于串行的Apriori的算法在时间上有更好的效率。当面对的数据量增大时,其挖掘时间也随之趋于线性增长。且分布式情况下,随着处理节点增多,挖掘效率显著提升,体现了并行算法在海量数据挖掘时的优越性和扩展性。
其他文献
实验研究了温度、有效氯含量、含盐量等因素对次氯酸钠溶液氧化性的影响。结果发现:常温常压下,漂水氧化还原电位主要受pH值控制,随着pH值的降低而升高;在pH值不变的情况下,
我国现阶段物流与供应链领域存在各自为营的现象,使得物流信息系统出现功能重叠建设、数据不标准、不能互通互联、供需不对称等问题,缺少以顾问式服务来整合供求服务的平台和
<正>"早岁那知世事艰,中原北望气如山"。南宋著名爱国诗人陆游,一生坎坷,但矢志不渝地主张北击女真,恢复中原。他61岁时,回顾过去,
目的:探索更年期综合征的治疗。方法:自拟研制更年乐验方。结果:总有效率为96.9%。结论:方解严密、准确透彻、明了,是治疗更年期综合征理想的中成药。
<正>由于借喻和借代都是隐去本体而只出现客体(指喻体和借体),形式上很相似,所以容易混淆,比较难分辨。那么如何辨别呢?一、看本体和客体之间是否有相似点,有相似点的是借喻,
票据的无因性脱胎于物权的无因性,同时又避免了物权无因性给物权所有人所带来的种种不公平,而胜于物权的无因性。本文从德国《民法典》的角度出发,探讨物权无因性和票据无因
现有关于人民币汇率各市场间关系的研究一般是基于多元GARCH模型,探讨各市场间的线性相关关系,未能考虑各市场间汇率变动可能存在的“不对称效应”:面临正(反)向的较大冲击时
为了与我国经济的快速发展相协调,铁路在近十年的时间内进行了六次大提速。列车速度的不断提高,使铁路运输能力大幅度增加。同时,也使研究车桥的动力相互作用问题显得尤为重要。
<正>心理契约(Psychological Contract)主要用于描述在员工与组织的相互关系中,除了书面契约规定的内容之外,还存在着隐含的、非正式的和未公开说明的相互期望。心理契约不仅