论文部分内容阅读
[摘 要]数据挖掘是近几年来随着数据库技术和人工智能技术的发展与应用而出现的一种全新的信息技术。随着电脑的广泛应用,使Web成为获取各方面信息的最重要的途径。Web凭借着自身的卓越条件,是它占据了主要市场。本文介绍了Web数据挖掘过程,以及特点,最后重点研究了Web数据挖掘技术现代商业中的应用。
[关键词]数据挖掘;电子商务;技术应用
中图分类号:F407.6 文献标识码:A 文章编号:1009-914X(2015)33-0142-01
一、对Web数据挖掘的综合概述
Web挖掘是从Web资源上抽取所需信息的过程,它是将传统的数据挖掘的思想和方法应用于Web。Web数据挖掘在很多方面都发挥着主导作用,如搜索引擎结构的数据挖掘,搜索引擎的开发,改进和提高搜索引擎的质量和效率,确定权威页面。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术等。特别是在电子商务领域,通过对用户特征的理解和分析,如对用户访问行为、频度、内容等的分析,提取出用户的特征,从而为用户定制个性化的界面,有助于开展有针对性的电子商务活动。
二、Web数据挖掘的特点
(一)半结构化数据。Web页面以某种格式呈现的半结构化数据,其数据不完整、结构不规则,复杂程度与普通文本相比远远高于普通的文本文档,其数据结构隐含、模式信息量大、模式变化快。大量的文档无任何排列次序,无分类索引。
(二)Web是一个异质、分布、动态的信息源。Web及其数据无固定的模式且更新、增长速度极快。Web上的信息几乎都是隐藏的、潜在的、未知的,从Web上发现这些未知的信息和有用的模式,仅用传统的基于关键字的检索方式很难实现,现在的搜索引擎尚不具备这些功能。
(三)面对一个非常广泛不同类型的用户群体,不同的用户对访问Web的爱好和使用目的各不相同,根据不同的用户,能否使用户根据自己的爱好兴趣定制网页,甚至能否根据发现的用户自动为用户定制网页,从而提供个性化的信息检索和查询服务。
三、Web数据在电子商务中的挖掘过程
(一)数据预处理。它包括数据清理、用户识别、用户会话识别、访问路径补充和事务识别等步骤。数据清洗的目的是删除Web日志中与数据不相关的冗余项,缩小被挖掘数据对象的范围。在数据净化后就必须确定单一的用户,用户识别的目的就是对用户惟一性的识别。
(二)模式识别。通常对即将处理之后的数据进行处理进而得到相应的事务数据库。在事务数据库的基础上度数据进行挖掘,总的来说需要进行一下两个方面的工作:其一将事务数据库进行整理使之变换成与一定挖掘技术相适应的数据存储形式;其二利用数据挖掘算法挖掘出更加有效的、新奇的、潜在的、有用的且可以进行实际研究的信息和知识。可用于Web的挖掘技术有路径选择、关联、分析、分类规则、聚类分析、序列分析、依靠性建模等。
(三)模式分析。该阶段的主要任务是从上一阶段收集的数据集中过滤掉不喜欢的或无关联的数据及模式,进而发现有趣模式。最常见的模式分析方法是SQL语言知识查询机制,也可以利用存储Web使用数据的数据库进行数据导入,再利用OLAP方法发现数据中的特定模式结果。
(四)可视化。主要是采用可视化的技术以图形界面的方式表示挖掘的成果。
四、Web数据挖掘技术在电子商务中的应用
目前对于,Web挖掘的对象和使用的方法层出不穷,但随着电子商务网站的兴起,电子商务将是未来Web挖掘的主要发展方向之一,因此它在各种商业领域都存在广泛的使用价值。在当电子商务在企业中得到应用时,企业信息系统将产生大量数据,这些海量数据使数据挖掘有了丰富的数据基础,同时高性能计算机和高传输速率网络的使用也给数据挖掘技术提供了坚实的保障。介绍以下几个方面的应用:
(一)分析查找获得潜在客户。随着以客户为中心的经营理念不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对电子商务系统收集的交易数据进行分析,可以按各种客户指标(如自然属性、收入贡献交易额、价值度等)对客户分类,然后确定不同类型客户的行为模式,以便采取相应的营销措施,促使企业利润的最大化。
(二)挽留老顾客。挖掘潜力在于客户通过Web挖掘,电子商务的经营者可以获的每位访问者的个人信息,充分地了解客户各方面的需要,然后根据每一类顾客的独特需求向他们提供特定的产品,并根据需求动态地向客户做页面推荐,从而调整Web页面,提高客户对所需产品的满意度,延长客户在网页的驻留时间,最终达到留住客户的目的。通过Web日志记录的充分挖掘,首先可以对已经存在的访问者进行分类,然后从所分的类别中判定出某个新客户是否是潜在的客户。
(三)制定产品营销策略,优化促销活动。通过对商品访问情况和销售情况进行挖掘,企业能够准确的获得客户的访问规律,确定顾客进行消费的生命周期,然后根据当前市场需求的变化,针对不同的产品制定相应的营销策略。
(四)降低运营成本,提高企业竞争力。电子商务的经营者通过Web数据挖掘,可以获得可靠的客户对产品的反馈信息,认真分析消费者的将来消费动向,进行有针对性的电子商务营销活动,还可以根据客户对某产品浏览模式和访问次数来设置广告的位置,进而增加了广告的针对性,提高广告的投资回收率,从而降低运营成本,提高企业竞争力。
五、结束语
随着计算机技术的迅发展和Internet资源的快速增长,特别是电子商务的兴起,Web挖掘成为二十一世纪的热门研究领域之一,其研究具有更加广阔的应用前景和巨大的现实意义。就目前国内的Web挖掘看还尚处于学习、跟踪和探索阶段,Web挖掘有许多问题有待于进一步的研究和深化,希望未来的发展能更好的服务于社会。
参考文献:
1.凌传繁.Web挖掘技术在电子商务中的应用[J].情报杂志,2006
2.郝先臣.基于电子商务中的数据挖掘技术研究[M].小型微型计算机系统,2007
3.邓英.李明.Web数据挖掘技术及工具研究[M].计算机工程与应用,2008
[关键词]数据挖掘;电子商务;技术应用
中图分类号:F407.6 文献标识码:A 文章编号:1009-914X(2015)33-0142-01
一、对Web数据挖掘的综合概述
Web挖掘是从Web资源上抽取所需信息的过程,它是将传统的数据挖掘的思想和方法应用于Web。Web数据挖掘在很多方面都发挥着主导作用,如搜索引擎结构的数据挖掘,搜索引擎的开发,改进和提高搜索引擎的质量和效率,确定权威页面。Web挖掘研究覆盖了多个研究领域,包括数据库技术、信息获取技术等。特别是在电子商务领域,通过对用户特征的理解和分析,如对用户访问行为、频度、内容等的分析,提取出用户的特征,从而为用户定制个性化的界面,有助于开展有针对性的电子商务活动。
二、Web数据挖掘的特点
(一)半结构化数据。Web页面以某种格式呈现的半结构化数据,其数据不完整、结构不规则,复杂程度与普通文本相比远远高于普通的文本文档,其数据结构隐含、模式信息量大、模式变化快。大量的文档无任何排列次序,无分类索引。
(二)Web是一个异质、分布、动态的信息源。Web及其数据无固定的模式且更新、增长速度极快。Web上的信息几乎都是隐藏的、潜在的、未知的,从Web上发现这些未知的信息和有用的模式,仅用传统的基于关键字的检索方式很难实现,现在的搜索引擎尚不具备这些功能。
(三)面对一个非常广泛不同类型的用户群体,不同的用户对访问Web的爱好和使用目的各不相同,根据不同的用户,能否使用户根据自己的爱好兴趣定制网页,甚至能否根据发现的用户自动为用户定制网页,从而提供个性化的信息检索和查询服务。
三、Web数据在电子商务中的挖掘过程
(一)数据预处理。它包括数据清理、用户识别、用户会话识别、访问路径补充和事务识别等步骤。数据清洗的目的是删除Web日志中与数据不相关的冗余项,缩小被挖掘数据对象的范围。在数据净化后就必须确定单一的用户,用户识别的目的就是对用户惟一性的识别。
(二)模式识别。通常对即将处理之后的数据进行处理进而得到相应的事务数据库。在事务数据库的基础上度数据进行挖掘,总的来说需要进行一下两个方面的工作:其一将事务数据库进行整理使之变换成与一定挖掘技术相适应的数据存储形式;其二利用数据挖掘算法挖掘出更加有效的、新奇的、潜在的、有用的且可以进行实际研究的信息和知识。可用于Web的挖掘技术有路径选择、关联、分析、分类规则、聚类分析、序列分析、依靠性建模等。
(三)模式分析。该阶段的主要任务是从上一阶段收集的数据集中过滤掉不喜欢的或无关联的数据及模式,进而发现有趣模式。最常见的模式分析方法是SQL语言知识查询机制,也可以利用存储Web使用数据的数据库进行数据导入,再利用OLAP方法发现数据中的特定模式结果。
(四)可视化。主要是采用可视化的技术以图形界面的方式表示挖掘的成果。
四、Web数据挖掘技术在电子商务中的应用
目前对于,Web挖掘的对象和使用的方法层出不穷,但随着电子商务网站的兴起,电子商务将是未来Web挖掘的主要发展方向之一,因此它在各种商业领域都存在广泛的使用价值。在当电子商务在企业中得到应用时,企业信息系统将产生大量数据,这些海量数据使数据挖掘有了丰富的数据基础,同时高性能计算机和高传输速率网络的使用也给数据挖掘技术提供了坚实的保障。介绍以下几个方面的应用:
(一)分析查找获得潜在客户。随着以客户为中心的经营理念不断深入人心,分析客户、了解客户并引导客户的需求已成为企业经营的重要课题。通过对电子商务系统收集的交易数据进行分析,可以按各种客户指标(如自然属性、收入贡献交易额、价值度等)对客户分类,然后确定不同类型客户的行为模式,以便采取相应的营销措施,促使企业利润的最大化。
(二)挽留老顾客。挖掘潜力在于客户通过Web挖掘,电子商务的经营者可以获的每位访问者的个人信息,充分地了解客户各方面的需要,然后根据每一类顾客的独特需求向他们提供特定的产品,并根据需求动态地向客户做页面推荐,从而调整Web页面,提高客户对所需产品的满意度,延长客户在网页的驻留时间,最终达到留住客户的目的。通过Web日志记录的充分挖掘,首先可以对已经存在的访问者进行分类,然后从所分的类别中判定出某个新客户是否是潜在的客户。
(三)制定产品营销策略,优化促销活动。通过对商品访问情况和销售情况进行挖掘,企业能够准确的获得客户的访问规律,确定顾客进行消费的生命周期,然后根据当前市场需求的变化,针对不同的产品制定相应的营销策略。
(四)降低运营成本,提高企业竞争力。电子商务的经营者通过Web数据挖掘,可以获得可靠的客户对产品的反馈信息,认真分析消费者的将来消费动向,进行有针对性的电子商务营销活动,还可以根据客户对某产品浏览模式和访问次数来设置广告的位置,进而增加了广告的针对性,提高广告的投资回收率,从而降低运营成本,提高企业竞争力。
五、结束语
随着计算机技术的迅发展和Internet资源的快速增长,特别是电子商务的兴起,Web挖掘成为二十一世纪的热门研究领域之一,其研究具有更加广阔的应用前景和巨大的现实意义。就目前国内的Web挖掘看还尚处于学习、跟踪和探索阶段,Web挖掘有许多问题有待于进一步的研究和深化,希望未来的发展能更好的服务于社会。
参考文献:
1.凌传繁.Web挖掘技术在电子商务中的应用[J].情报杂志,2006
2.郝先臣.基于电子商务中的数据挖掘技术研究[M].小型微型计算机系统,2007
3.邓英.李明.Web数据挖掘技术及工具研究[M].计算机工程与应用,2008