浅谈web数据挖掘在电子商务领域中的应用

被引量 : 0次 | 上传用户:youxiing
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘 要:本文通过对数据挖掘技术在电子商务领域的应用现状进行调研,让更多的人了解数据挖掘技术,通过数据挖掘技术给企业带来经济效益,促进社会的发展。
  关键词:数据挖掘技术; 电子商务; 载体
  中图分类号:TP311.13 文献标识码:A 文章编号:1006-3315(2013)02-173-001
  Web数据挖掘在电子商务中的研究和应用,已经越来越受到人们的重视和关注,它的前景广阔,势头良好。并且经过各类电子商务网站的实践以及经验的证明,电子商务的优点突出,它不仅价格低廉,而且交易方便,它吸引着无数的消费者。对于电子商务网站来说,要了解到顾客的购买意向、吸引顾客的活动、了解顾客的购物行为心理。这些都是当前需要研究的问题。通过数据的挖掘技术的应用,我们就能够从海量的数据信息当中提取出那些相对来说比较有用的信息,来帮助商家对客户进行进一步的理解,才能够推出更多更为实惠的商业服务。并且通过数据的挖掘,瞄准一个客户群体,通过一些比较特殊的信息手段来进行一次宣传工作,以此来更大的对广告的预算以及增加收入进行减少,从而让这一切都能够自行完成。
  一、数据挖掘流程
  Web数据挖掘就是利用数据挖掘技术,从网络文档和服务中发现和提取信息。与传统数据和数据仓库相比,Web上的信息是非结构化或半结构化的、动态的、并且是容易造成混淆的,所以很难直接以Web网页上的数据进行数据挖掘,而必须经过必要的数据处理。Web挖掘有以下几个过程:
  1.资源发现。任务是从目标Web文档中得到数据,值得注意的是有时信息资源不仅限于在线Web文档,还包括电子邮件、电子文档、新闻组,或者网站的日志数据,甚至是通过Web形成的交易数据库中的数据。
  2.信息选择和预处理。任务是从取得的Web资源中剔除无用信息和将信息进行必要的整理。例如从Web文档中自动去除广告连接、去除多余格式标记、自动识别段落或者字段并将数据组织成规整的逻辑形式甚至是关系表。
  3.模式发现。自动进行模式发现。可以在同一个站点内部或在多个站点之间进行。
  4.模式分析。验证、解释上一步骤产生的模式。可以是机器自动完成,也可以是与分析人员进行交互来完成。
  二、Web挖掘的特点
  Web是一个巨大、分布广泛、全球性的信息服务中心,涉及经济、文化、教育、新闻、广告、消费、娱乐、金融、保险、销售、电子商务等信息,内容极其丰富,数据最大特点就是半结构化;而传统的数据库中的数据结构性很强,即其中的数据为完全结构化的数据。显然,面向Web的数据挖掘比面向单个数据仓库的数据挖掘要复杂得多,会面临很多具体问题,主要有:
  1.半结构化数据。Web页面以某种格式呈现的半结构化数据,其数据结构不规则或不完整,复杂程度远远高于普通的文本文档,其数据结构隐含、模式信息量大、模式变化快。大量的文档无任何排列次序,无分类索引。
  2.Web是一个异质、分布、动态的信息源。Web及其数据的更新、增长速度极快,也无固定的模式。Web上的信息几乎都是隐藏的、潜在的、未知的,从Web上发现这些未知的信息和有用的模式,仅用传统的基于关键字的检索方式很难实现,现在的搜索引擎尚不具备这些功能。
  3.面对一个非常广泛的形形色色的用户群体。不同的用户访问Web的兴趣、爱好和使用目的千差万别,面对一个非常广泛的形形色色的用户群体,能否使用户根据自己的爱好兴趣定制网页,甚至能否根据发现的用户,自动为用户定制网页,从而提供个性化的信息检索和查询服务。
  三、数据挖掘在电子商务中的应用
  目前对于Web挖掘的对象和使用的方法层出不穷,但随着电子商务网站的兴起,电子商务将是未来Web挖掘的主要发展方向之一,因此它在各种商业领域都存在广泛的使用价值。当电子商务在企业中得到应用时,企业信息系统将产生大量数据,这些海量数据使数据挖掘有了丰富的数据基础,同时高性能计算机和高传输速率网络的使用,也给数据挖掘技术提供了坚实的保障。介绍以下几个方面的应用。
  1.优化企业资源
  节约成本是企业盈利的关键。基于数据挖掘技术,实时、全面、准确地掌握企业资源信息,通过发现企业资源消耗的关键点和主要活动的投入产出比例,从而为企业资源优化配置提供决策依据。通过对Web数据挖掘,快速提取商业信息,极大地提高企业对市场变化的响应能力和创新能力,使企业最大限度地利用人力资源、物质资源和信息资源,合理协调企业内外部资源的关系,产生最佳的经济效益。促进企业发展的科学化、信息化和智能化。
  2.管理客户数据
  利用数据挖掘可以有效地获得客户。通过数据挖掘可以发现购买某种商品的消费者是男性还是女性,学历、收入如何,有什么爱好,是什么职业等等。甚至可以发现不同的人在购买该种商品的相关商品后多长时间有可能购买该种商品,以及什么样的人会购买什么型号的该种商品等等。在采用了数据挖掘后,针对目标客户发送的广告的有效性和回应率将得到大幅度的提高,推销的成本将大大降低。
  3.评估商业信用
  由于网上诈骗现象层出不穷,利用数据挖掘技术对企业经营进行跟踪,开展企业的资产评估、利润收益分析和发展潜力预测,构建完善的安全保障体系,强化网上交易和在线支付的安全管理。基于数据挖掘的信用评估模型,对交易历史数据进行挖掘,发现客户的交易数据特征,建立客户信誉度级别,有效地防范和化解信用风险,提高企业信用甄别与风险管理的水平和能力。
  4.确定异常事件
  在许多商业领域中,异常事件具有显著的商业价值,如客户流失、银行的信用卡欺诈、电信中移动话费拖欠等。通过数据挖掘中的奇异点分析可以迅速准确地甄别这些异常事件,为企业采取决策提供依据,减少企业不必要的损失。
  可以看出,数据挖掘的研究和应用受到了学术界和实业界越来越多的重视。我们希望数据挖掘能够引起国内实业界更多的重视,同时也希望能够有更多的国内软件厂商进入该领域,一起促进数据挖掘技术在中国的应用。
其他文献
教师不健康的心理会严重影响他们的工作和生活,而且也会影响学生的认知和发展。目前,中小学教师的心理健康存在着严重的问题,必须引起足够的重视。该文从社会、学校、家庭三
金鱼是我国特有的观赏鱼,因它独特的色彩、优美的体态,令人所喜爱。人们爱称它为“金鳞仙子”、“水中牡丹”、“水中活花朵”、“东方圣鱼”,历代不少以金鱼为主题的寓言童
中国共产党是一个具有十分优良的政党文化的政党。但长期以来党内也存在着一些不良文化因子。这些不良文化因子的生成既有传统历史文化的原因,也有党的自身结构和制度的原因。
自20世纪90年中期以后,中国口头诗学研究和教学在国内取得了长足的发展,积累了大量可资借鉴与展开对话的研究成果与教学经验。在朝戈金、尹虎彬、巴莫曲布嫫、陈岗龙、刘宗迪等
<正> 有一位医学专家戏言:“感冒如不服药,两周即可自愈,如果服药治疗,则需14天”。听起来好像在说笑话,其实是有一定道理的。美国一研究感冒药物治疗的机构,经10余年来研究
在超市、商场内,奶粉大体上可分为全脂加糖、全脂低糖、脱脂加糖、脱脂无糖四种类型.全脂奶粉是指牛奶挤出后,直接经过浓缩、干燥而成的,含有较多乳脂、胆固醇等.脱脂奶粉则
期刊
本文在对我国手机动漫现状分析的基础上,分析了影响手机动漫发展的因素,以及3G时代对手机动漫的促进作用。
MC145158是摩托罗拉公司生产的锁相环(PLL)频率合成器。文中介绍了MC145158芯片的内部结构和性能特点,并利用该芯片设计了150兆赫兹接收机的频率合成器部分,该频率合成器具有很高
【正】一、虚拟经济的特点与功能以虚拟资本为核心、以金融系统为主要循环依托的直接以钱生钱的虚拟经济,其特点可以归纳为以下几点:复杂性、介稳性、高风险性、依附性、周期
2010年6月,经内蒙古自治区高等学校科学研究项目和教育厅组织专家评审,我院共有11项申请课题获得批准。其中自然科学重点项目1项,一般项目3项;人文社会科学重点项目一项,一般