论文部分内容阅读
在信息和知识经济时代,随着网络技术的迅猛发展和社会信息化水平的提高,传统的贸易正经历一次重大的变革,电子商务显示出巨大的市场价值和发展潜力。电子商务是商业领域的一种新兴商务模式,它是以网络为平台、现代信息技术为手段、以经济效益为中心的现代化商业运转模式,其最终目标是实现商务活动的网络化、自动化与智能化。电子商务的产生改变了企业的经营理念、管理方式和支付手段,给社会的各个领域带来了巨大的变革。当电子商务在企业中得到应用时,企业信息系统将产生大量数据,这些激增的电子化数据意味着人们面临“数据丰富而知识贫乏”的问题。如何才能不被信息的汪洋大海所淹没,从中及时发现有用的信息和知识,提高信息利用率,为企业创造更多潜在的利润。八十年代末兴起的数据挖掘(Data Mining)技术,就是从这样的商业角度开发出来的。数据挖掘技术可以为新的商业处理信息,把历史积累的大量数据进行抽取、转换、分析和其他模型化的挖掘和处理,从中发现隐藏的规律或模式,提取辅助商业决策的关键性数据,为决策提供支持。利用数据挖掘技术,能对数据进行充分挖掘,发现数据所蕴涵的有用知识,帮助企业业务决策和战略发展,从而使企业在市场竞争中获得优势地位。因此数据挖掘在电子商务系统中的应用成为当前研究的重要课题。电子商务是现代信息技术迅速发展的必然产物,也是未来企业模式的必然选择。数据挖掘技术引入电子商务,给企业的商务活动提供全面支持,为客户提供个性化服务,增强企业的商务智能。数据挖掘是电子商务取得更多成就的必然方向,它将数据转化为知识,是数据管理、信息处理领域研究、开发和应用的最活跃的分支之一。它帮助决策者寻找数据间潜在的关联,发现被忽略的因素,是解决数据爆炸而信息贫乏问题的一种有效方法。数据挖掘的一个重要分支—关联规则挖掘,主要用于发现数据集中项之间的相关联系。由于关联规则挖掘技术形式简洁、易于解释和理解并可以有效地捕捉数据间的重要关系,从大型数据库中挖掘关联规则问题己成为数据挖掘中最成熟、最重要、最活跃的研究内容。本文首先介绍数据挖掘技术,包括数据挖掘的概念、功能和过程等。其次,对关联规则挖掘算法进行深入的研究,重点分析了关联规则中的经典算法—Apriori算法,简单介绍了电子商务的概念、特点等,结合实例分析Apriori算法在零售业中的应用,并指出了挖掘中的关键步骤及该算法的不足。针对Apriori算法的不足,对Apriori算法提出了改进,使得寻找频繁项集的工作得以分布化,并行化。然后介绍了面向电子商务数据挖掘的特点、体系结构等,详细介绍面向电子商务数据挖掘的应用。最后给出本文总结及对今后工作的展望。