论文部分内容阅读
计算机技术与网络技术飞速发展,使电子商务显示出越来越强大的生命力,因其高效与便捷的特点使人们从传统的购物方式逐渐转向网络购物方式,日益接受其网络交易的模式。随着越来越多的公司进入电子商务界,电子商务公司如何拓展客户,从众多的使用者中发掘出潜在客户,对电子商务公司的发展是相当重要的.基于上述情况,设计了将数据挖掘应用于电子商务的潜在用户分析,利用电子商务系统数据库中的存储的大量用户信息及交易数据,经过分类转换之后采用Apriori关联规则算法的数据挖掘技术进行挖掘,并得到电子商务用户之间的关联关系.通过分析这些数据找到电子商务用户中的哪些能成为真正使用者或者说是潜在客户,从而为电子商务公司的发展决策提供科学依据。数据挖掘的过程就是发现隐藏在各种尚没有处理的原始数据集合中的各种相关联系,并从这些联系中提取知识的过程。数据挖掘是多种计算机相关学科相结合的产物,其包含了数据库技术、计算机机器自主学习、数据统计分析、行为模式识别、人工神经网络等等学科。由于其具有很高的商业使用价值,同时适合应用的范围极为广泛,所以目前数据挖掘的相关研究已成为研究的重点之一。论文首先对电子商务的现状进行了分析,发现其存在的问题,即海量的数据信息无法得到有效利用。之后提出了采用数据挖掘对数据信息进行挖掘,从而找到电子商务中的潜在客户的这一个设想。接着对数据挖掘、关联规则等各种相关知识进行了阐述,并对它们的发展情况,以及国内外数据挖掘的现状做了简单的综述。分析了电子商务平台中数据挖掘系统发展现状,以及应用数据挖掘会给电子商务带来何种优势。然后重点研究了关联规则经典频繁集算法(Apriori算法)的原理,以及如何将挖掘算法应用于电子商务系统中,针对它的缺点,提出了一种改进算法。从而在挖掘事务数据库时,将要查询的数据表取出放入内存中,从而使以后每次扫描时不需要再访问数据库,而是直接访问内存,从而使速度增快;能减少对数据库的访问次数,同时建立辅助表,来帮助减少扫描频繁项集节点次数,从而提高整个挖掘的效率。最后介绍了将Apriori算法应用到电子商务,设计了潜在客户分析系统,通过对源数据库中客户各种相关基本信息的提取、整合,之后进行挖掘分析来得出结论,哪些客户能成为潜在的客户。