论文部分内容阅读
摘要: 随着互联网的迅猛发展,web上的信息飞速增长,如何从大量的数据集合中抽取有用的信息,找到有效的数据管理和使用的平台,合理的组织网站结构,成为人们越来越关心的课题。Web数据挖掘是从Web上挖掘有用知识为目标,利用web数据挖掘技术分析其在电子商务系统中的应用,能够发现潜在的客户信息,改进站点的结构,提供优质的个性化服务,从而提高企业的竞争力。
关键词: 数据挖掘;电子商务系统;web内容挖掘;web结构挖掘;web应用挖掘
中图分类号:TP3文献标识码:A文章编号:1671-7597(2011)0110185-01
随着Internet的迅猛发展,互联网上的各种信息飞速增长,如何从这个庞大的数据集合中抽取有用的信息,找到提供数据管理和使用的平台;如何合理的组织网站建设,更加人性化的给用户提供服务;如何从海量的网络信息中迅速的找到用户最为关心的信息,成为人们越来越关心的课题。
数据挖掘技术为解决这个问题带来了希望,通过数据挖掘技术在Web上的应用,企业可以分析和预测顾客的将来行为,改进站点结构,可以大大降低运营成本,Web数据挖掘技术就是在此背景下产生的。Web数据挖掘是以从Web上挖掘有用知识为目标,它将传统的数据挖掘技术与Web结合起来,利用数据挖掘技术从Web页面和Web日志中发现有效的、新颖的、潜在的有用的的信息,它是一门交叉性学科、涉及数据挖掘、人工智能、机器学习、数据仓库、统计学、信息学、计算机网络技术、计算机语言学等多个领域。
Web数据挖掘可分为3类:Web内容挖掘(web content mining)、web结构挖掘(web structure mining)、web应用挖掘(web usage mining)[1]。
1)Web内容挖掘是提取文字、图片或者其他组成网页内容成分的信息和知识。搜索引擎、智能代理和一些推荐引擎都使用内容挖掘来帮助客户在浩瀚的网络空间中寻找所需要的内容。
Web内容挖掘有两种策略:页面文本内容挖掘;对搜索引擎的查询结果进行进一步的处理,得到更为精确和有价值的信息。
2)Web结构挖掘主要是用来提取网络的拓扑信息,即网页之间的链接信息。
通过对Web站点的超链接结构进行分析、变形和归纳,将Web页面进行分类,以利于信息的搜索。超链接信息包含了人类潜在的注释,大量的Web超链接信息提供了关于Web页面内容相关性、质量和结构方面的信息,它有助于自动推断出页面的权威性。当一个页面包含指向另一个页面的超链接时,可以认为是对另一个页面的认可。把对一个页面的不同注解收集起来,就可以用来反映该页面的重要性。
3)Web应用挖掘是用来提取关于客户如何运用浏览器浏览和使用页面链接的信息。从web的访问记录中抽取感兴趣的模式。例如顾客访问了哪些页面,在每个页面上停留的时间,下一步又单击哪个页面等等。这些信息可以在WWW的每个服务器上访问日志中得到,Web日志记录了关于用户访问和交互的信息,体现了用户使用Web资源的行为特点,以及隐藏在行为背后的更深层次的动因和规律,发现用户的需要和兴趣,从而改进站点的结构,为用户提供个性化的服务。因此,Web日志的挖掘作为Web挖掘的一个重要组成部分,有其独特的理论和实践意义。
随着电子商务的兴起和迅猛发展,人们掀起了网上购物的热潮,所以Web挖掘的一个重要应用方向就是电子商务系统。而与电子商务关系最为密切的是Web访问信息挖掘。例如有多少人访问了该页面,哪些页面最受欢迎等。因此,销售商主要的挑战,是需要尽可能多地了解顾客爱好及价值取向,得到可靠的市场反馈信息,才能保证其在电子商务时代的竞争力。下面是web挖掘在电子商务中的具体应用。
1 延长用户停留时间,提供优质服务
对于电子商务系统来说,客户与销售商之间的空间距离己经不存在了。那么如何使客户在自己的销售站点上驻留更长的时间,对销售商来说将是一个挑战。为了达到这一目的,就应该了解客户的浏览行为,客户的兴趣及需求,动态地调整Web页面,更好的建立站点结构。
通过服务器与用户交互过程,收集用户的信息,Web服务器根据这些信息对用户请求的页面信息而进行筛选,观察用户跳转页面的规律,总结用户习惯的链接模式。例如a.html链接了b.html,b.html链接了c.html,若发现大多数用户在b.html页面上停留时间很短,就跳转到了c.html,可以改进链接结构,去掉b.html,由a.html直接链接到c.html,其目的就是提高用户的满意度和提供优质的服务。
2 挖掘潜在客户
通过对日志数据项进行统计,筛选出用户频繁访问的页面、单位时间的访问数、访问数量随时间分布图等。对日志中的客户访问信息进行挖掘,利用分类技术在日志中找到潜在的客户。首先对Web访问者进行分类,对于一个新的访问者,通过在Web上的分类发现,识别出这个客户与老客户的一些公共的描述,从而对这个新客户进行正确的分类,然后从它的分类判断这个新客户是有分析价值的客户群,还是属于无分析价值客户群,决定是否要把这个新客户作为潜在的客户来对待。客户的类型确定后,就可以对客户动态地展示Web页面,页面的内容取决于客户与销售商提供的产品和服务之间的关联。
3 优化网站设计
通过挖掘用户的频繁访问路径和用户聚类,改善站点中页面之间的链接关系,适应用户访问习惯,同时为用户提供个性化的服务。
对Web日志分析,判断出在一个Web站点中最频繁的访问路径,可以考虑把最新的、最时尚、最重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量。所以web设计者不再完全依靠专家的定性指导来设计网站,而是根据访问者的信息来修改和设计网站结构、外观。
总之,通过对web数据进行挖掘,改进电子商务系统的设计,给客户推出个性化页面,把用户最感兴趣的信息放在首页,可以更能吸引客户。企业可以根据用户的需求,增强此类产品的设计和生产,同时给网站带来更多的效益。随着web挖掘技术的不断深入和成熟,将会对社会经济发展带来巨大的推动作用。
参考文献:
[1]陈文伟,数据仓库与数据挖掘教程,清华大学出版社,2006,8.
[2]朱明,数据挖掘,合肥:中国科学技术大学出版社,2002(5):5.
[3]苏新宁,数据挖掘理论与技术,北京:科学技术文献出版社2003(6):
228.
关键词: 数据挖掘;电子商务系统;web内容挖掘;web结构挖掘;web应用挖掘
中图分类号:TP3文献标识码:A文章编号:1671-7597(2011)0110185-01
随着Internet的迅猛发展,互联网上的各种信息飞速增长,如何从这个庞大的数据集合中抽取有用的信息,找到提供数据管理和使用的平台;如何合理的组织网站建设,更加人性化的给用户提供服务;如何从海量的网络信息中迅速的找到用户最为关心的信息,成为人们越来越关心的课题。
数据挖掘技术为解决这个问题带来了希望,通过数据挖掘技术在Web上的应用,企业可以分析和预测顾客的将来行为,改进站点结构,可以大大降低运营成本,Web数据挖掘技术就是在此背景下产生的。Web数据挖掘是以从Web上挖掘有用知识为目标,它将传统的数据挖掘技术与Web结合起来,利用数据挖掘技术从Web页面和Web日志中发现有效的、新颖的、潜在的有用的的信息,它是一门交叉性学科、涉及数据挖掘、人工智能、机器学习、数据仓库、统计学、信息学、计算机网络技术、计算机语言学等多个领域。
Web数据挖掘可分为3类:Web内容挖掘(web content mining)、web结构挖掘(web structure mining)、web应用挖掘(web usage mining)[1]。
1)Web内容挖掘是提取文字、图片或者其他组成网页内容成分的信息和知识。搜索引擎、智能代理和一些推荐引擎都使用内容挖掘来帮助客户在浩瀚的网络空间中寻找所需要的内容。
Web内容挖掘有两种策略:页面文本内容挖掘;对搜索引擎的查询结果进行进一步的处理,得到更为精确和有价值的信息。
2)Web结构挖掘主要是用来提取网络的拓扑信息,即网页之间的链接信息。
通过对Web站点的超链接结构进行分析、变形和归纳,将Web页面进行分类,以利于信息的搜索。超链接信息包含了人类潜在的注释,大量的Web超链接信息提供了关于Web页面内容相关性、质量和结构方面的信息,它有助于自动推断出页面的权威性。当一个页面包含指向另一个页面的超链接时,可以认为是对另一个页面的认可。把对一个页面的不同注解收集起来,就可以用来反映该页面的重要性。
3)Web应用挖掘是用来提取关于客户如何运用浏览器浏览和使用页面链接的信息。从web的访问记录中抽取感兴趣的模式。例如顾客访问了哪些页面,在每个页面上停留的时间,下一步又单击哪个页面等等。这些信息可以在WWW的每个服务器上访问日志中得到,Web日志记录了关于用户访问和交互的信息,体现了用户使用Web资源的行为特点,以及隐藏在行为背后的更深层次的动因和规律,发现用户的需要和兴趣,从而改进站点的结构,为用户提供个性化的服务。因此,Web日志的挖掘作为Web挖掘的一个重要组成部分,有其独特的理论和实践意义。
随着电子商务的兴起和迅猛发展,人们掀起了网上购物的热潮,所以Web挖掘的一个重要应用方向就是电子商务系统。而与电子商务关系最为密切的是Web访问信息挖掘。例如有多少人访问了该页面,哪些页面最受欢迎等。因此,销售商主要的挑战,是需要尽可能多地了解顾客爱好及价值取向,得到可靠的市场反馈信息,才能保证其在电子商务时代的竞争力。下面是web挖掘在电子商务中的具体应用。
1 延长用户停留时间,提供优质服务
对于电子商务系统来说,客户与销售商之间的空间距离己经不存在了。那么如何使客户在自己的销售站点上驻留更长的时间,对销售商来说将是一个挑战。为了达到这一目的,就应该了解客户的浏览行为,客户的兴趣及需求,动态地调整Web页面,更好的建立站点结构。
通过服务器与用户交互过程,收集用户的信息,Web服务器根据这些信息对用户请求的页面信息而进行筛选,观察用户跳转页面的规律,总结用户习惯的链接模式。例如a.html链接了b.html,b.html链接了c.html,若发现大多数用户在b.html页面上停留时间很短,就跳转到了c.html,可以改进链接结构,去掉b.html,由a.html直接链接到c.html,其目的就是提高用户的满意度和提供优质的服务。
2 挖掘潜在客户
通过对日志数据项进行统计,筛选出用户频繁访问的页面、单位时间的访问数、访问数量随时间分布图等。对日志中的客户访问信息进行挖掘,利用分类技术在日志中找到潜在的客户。首先对Web访问者进行分类,对于一个新的访问者,通过在Web上的分类发现,识别出这个客户与老客户的一些公共的描述,从而对这个新客户进行正确的分类,然后从它的分类判断这个新客户是有分析价值的客户群,还是属于无分析价值客户群,决定是否要把这个新客户作为潜在的客户来对待。客户的类型确定后,就可以对客户动态地展示Web页面,页面的内容取决于客户与销售商提供的产品和服务之间的关联。
3 优化网站设计
通过挖掘用户的频繁访问路径和用户聚类,改善站点中页面之间的链接关系,适应用户访问习惯,同时为用户提供个性化的服务。
对Web日志分析,判断出在一个Web站点中最频繁的访问路径,可以考虑把最新的、最时尚、最重要的商品信息放在这些页面中,改进页面和网站结构的设计,增强对客户的吸引力,提高销售量。所以web设计者不再完全依靠专家的定性指导来设计网站,而是根据访问者的信息来修改和设计网站结构、外观。
总之,通过对web数据进行挖掘,改进电子商务系统的设计,给客户推出个性化页面,把用户最感兴趣的信息放在首页,可以更能吸引客户。企业可以根据用户的需求,增强此类产品的设计和生产,同时给网站带来更多的效益。随着web挖掘技术的不断深入和成熟,将会对社会经济发展带来巨大的推动作用。
参考文献:
[1]陈文伟,数据仓库与数据挖掘教程,清华大学出版社,2006,8.
[2]朱明,数据挖掘,合肥:中国科学技术大学出版社,2002(5):5.
[3]苏新宁,数据挖掘理论与技术,北京:科学技术文献出版社2003(6):
228.