基于用户购买记录的改进关联规则挖掘算法研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:zohan_rfs
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
飞速发展的电子商务产业催生了数据总量的爆炸性增长,从大量数据中发现和提取人们感兴趣的知识,让数据带来价值越来越受到人们的关注。而数据挖掘在电子商务中的成功运用为人们分析和研究大量的相关数据提供了一条行之有效的方法和途径。  关联规则挖掘作为数据挖掘领域的一项重要研究方法,可以用来发现交易数据库中不同商品之间的联系,也可以用于发现在用户浏览网页时,不同的访问记录之间的关联。关联规则对于用户浏览行为和购买行为的分析可以给电商网站的销售策略和网站布局提供很多有价值的建议,有助于网站经营者作出更好的商业决策。  本文首先介绍了电子商务环境下数据挖掘的定义、过程和功能,并对几种重要的挖掘方法进行了分析。其次,本文重点介绍了最常用的两种关联规则挖掘算法,Apriori算法和FP-Growth算法的基本思想和挖掘过程,并用实例说明了算法的运行过程并分析这两种算法的局限之处。Apriori算法需要重复多次的搜寻与遍历事务数据库,这导致了大量的时间消耗与浪费,从而增加了算法运行的时间。而FP-Growth算法需要构建基于内存的FP-tree,当面对事物数据库比较大时可能导致算法的挖掘失败。最后,本文针对Apriori算法和FP-Growth算法的局限,综合两位专家学者对于FP-Growth算法的改进研究,提出了FP-Growth算法的改进算法IM-FP算法。IM-FP算法对事务数据库进行分解并将分解后的事务数据库根据频繁1-项集的支持度计数进行排序,并根据首元素的不同分别存储在不同的链表中,基于链表构建IMFP-tree,并对其进行频繁项集发现和关联规则挖掘。IM-FP算法采用分解事务数据库的方法可以处理大型数据库的挖掘工作,同时对首项相同的链表构建IMFP-tree可以最大限度的共享前段路径,降低了算法构建频繁模式树所占用的计算机内存资源,降低了算法的运算时间。通过进行几种算法的对比实验,实验结果证明该算法的挖掘结果和FP-Growth算法的挖掘结果完全相同,同时算法在处理大型数据库的挖掘时,算法的时间复杂度要大大低于FP-Growth算法。  在本文的最后部分,采用了IM-FP算法对电子商务网站的用户购买数据进行了关联规则挖掘,从商品品类和单个商品两个维度得出挖掘结果,基于关联规则的挖掘结果和对于相关文献资料的分析研究,本文对电商网站经营策略的改进和数据挖掘算法在电子商务中的应用提出了一些可行的建议策略。
其他文献
一、5G的能量:关键技术rn随着工信部5G商用牌照的发放,我国正式进入5G商用元年.5G网络作为第五代移动通信网络,具有超高带宽、超多连接、超低时延三大特性.与4G相比,5G的提升
期刊
长期在应试教育体制下,初中化学课堂重知识、追求结果,轻视化学能力的培养,丧失等待化学素养形成的“慢过程”,忽视了化学是与生活、社会紧密相连的实用性自然学科,“从学生
本文介绍了三榀钢支撑钢筋混凝土框架结构(包括两榀复合耗能支撑框架、一榀普通支撑框架)在低周反复荷载作用下的试验结果。对复合耗能支撑框架结构在低周反复荷载作用下的工作
随着我国社会经济的快速发展,国家教育事业的改革不断进行,力度也持续增大,在推进素质教育中也对高中生物教学提出了更多和更高的要求,现在的素质教育中很多都需要培养学生各
美术教师的专业性强,其专业能力、教学能力和科研能力的发展是一个不断学习积累的过程.美术教师可以通过制定个人专业发展规划、不断学习创作来实现个人的专业发展,通过挖掘
为提高教学质量、改变单一的线下授课方式,文章对超星学习通+线下混合模式教学进行探索,从课前导入、课中教学、课后作业和课程考核四个方面进行课程设计;将超星学习通作为教
幼儿与生俱来有丰富的想象力与创造力,积极实现对幼儿的美术教育,能够更好地促进其创造力的系统化发展.本文首先对美术教育中培养幼儿创造力的必要性进行了深入研究,然后对如
音乐是情感的艺术,唯有以情感作为载体,将情感融入作品的演绎中,才能使音乐作品富有生命力,也才能触动听众的心弦.因此,在高中音乐教学中,我们教师要时刻渗透这一基本理念,让
第五代移动通信技术(简称5G或5G技术)是最新一代蜂窝移动通信技术,也是即4G、3G和2G技术之后的延伸.5G的性能目标主要是高数据速率、减少延迟、节省能源、降低成本、提高系统
期刊
2009年新年伊始,由中国电视艺术委员会主办的上海文广新闻传媒集团艺术人文频道专家研讨会在国家广电总局举行,来自中宣部文艺局、国家广电总局主管部门、上海文广新闻传媒集