基于WEB访问信息挖掘提高电子商务个性化服务研究

来源 :商场现代化 | 被引量 : 0次 | 上传用户:wj34271996
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  [摘 要] 随着Internet的发展,个性化信息服务已经被广泛应用到很多领域.本文阐述了电子商务个性化服务的数据挖掘方法,并对电子商务个性化服务的实现进行了探讨。
  [关键词] 数据挖掘 Web访问信息挖掘 个性化服务 电子商务
  
  一、引 言
  随着internet技术的发展,个性化信息服务已经被广泛应用到很多领域:如个性化导航、个性化网站等。尤其是在电子商务领域,对用户进行个性化服务,已经成为许多电子商务企业追求的目标。
  WEB访问信息挖掘就是对用户访问WEB时在服务方留下的访问记录进行挖掘,即对用户访问WEB站点的存取方式进行挖掘。挖掘对象是在服务器上的包括server log data等在内的日志文件记录。
  二、电子商务个性化服务的数据挖掘方法
  访问信息挖掘是在电子商务上进行知识发现,最关键的是进行客户访问信息的挖掘,得到客户的浏览行为和访问模式,从而发现客户的兴趣、爱好等有用的市场信息,最常用的挖掘方法有:
  1.路径分析
  常用于判定在一个web站点中最频繁访问的路径。如:80%的用户在存取/company/prodcut1时是经过/company/new。通过客户访问的路径分析,可以改进页面和网站目录结构的设计,使用户直奔所需,减少客户的流失率。
  2.关联规则挖掘
  使用关联规则挖掘可以从WEB访问事务集中,找到一般性的关联知识。如:30%的客户在访问/company/prodcut1也访问了/company/prodcut2。利用这些相关性,可更好地组织WEB空间,实施有效的营销策略。
  3.序列模式发现
  序列模式发现就是在时间戳有序的事务集中,找到那些“一些项跟随另一些项”的内部事务模式,即挖掘出交易集之间有时间序列关系的模式。如:在company/prodcut1上进行订购的用户中有60%的在一个月内也订购了company/prodcut2。序列模式发现能够预测客户的访问模式,了解客户的兴趣及需求所在,采取有针对性的广告服务,以满足访问者的特定要求。
  4.分类
  分类就是为具有某些公共属性的特定群体建立概要特征,这些特征可以用来对新增到数据库里的数据项进行分类。如学生用户一般感兴趣的页面是company/prodcut1。分类能够使商家根据访问网站的人口统计学信息和用户的访问模式得出访问某一商业网站的用户轮廓特征。对用户分类后,就可以发现未来的潜在客户并开展有针对性的商务活动。
  5.聚类分析
  聚类分析可以从服务器访问信息数据中聚集出具有相似特性的客户组,即把有相似特性的用户、数据项集合到一起。如自动给一个待定的顾客聚类发送销售邮件。通过这些举措使商务活动能够在一定程度上满足客户的要求,实现目标营销。
  三、电子商务个性化服务的实现
  1.Web访问信息挖掘基本步骤
  Web访问信息挖掘的基本步骤为:数据收集,数据预处理,模式识别,模式分析。
  数据收集就是要记录用户访问行为,主要方式有在服务器端进行数据收集、在客户端进行数据收集、在代理端进行数据收集等。原始数据需要经过预处理后才能有效实施挖掘算法,数据预处理的质量与Web挖掘的效率和结果紧密相关,其内容包括:数据净化、用户识别、会话识别、事务识别、路径补充等。然后要对预处理后的数据进行模式识别,即实施挖掘算法。模式分析的目的是根据实际应用,通过观察和选择,把发现的统计结果、规则和模型转换为知识,经过筛选后用来指导实际的电子商务行为。常用的手段有:信息过滤、可视化、联机分析处理等。
  2.电子商务个性化系统结构
  电子商务个性化系统如下图所示。
  通过上图可知,电子商务个性化系统一般分为两个部分:
  离线部分:用于挖掘用户的特性信息。
  在线部分:用于识别用户,推荐个性化服务。
  Web访问信息挖掘是离线处理的,而当用户访问该网站时通过在线推荐引擎进行在线服务。挖掘算法和推荐策略可以根据不同类型站点的要求来具体选择,挖掘结果和推荐集通过推荐引擎反馈给用户。电子商务网站的会员用户通过会员标识登录网站以后,其访问信息将会被记录到服务器端。这些数据将在经过预处理后,在专用的数据挖掘模块中,通过具体的挖掘算法和推荐策略来进行模式识别和模式分析。用户访问信息也会传到推荐引擎,推荐引擎根据用户的会员标识,向挖掘模块抽取对应用户的挖掘结果和推荐集,将其可视化地反馈给用户,达到个性化服务的目的。
  四、结束语
  随着互联网的普及和电子商务的发展,电子商务系统在为用户提供越来越多选择的同时,利用WEB访问信息挖掘技术,必然对电子商务网站提供个性化服务产生积极的影响。
  参考文献:
  [1]毛国君 段立娟:数据挖掘原理与算法[M].清华大学出版社,2005.7
  [2]冯是聪 单松魏 张志刚:基于Web挖掘的个性化技术研究.计算机工程与设计, 2004 Vol.25 No.1
其他文献
[摘要] 介绍基于PHP与PKZIP的ZIP文件的上传与解压技术,并通过具体的应用示例说明其编程模式。  [关键词] PHP PKZIP ZIPA    一、引言    目前,各类Web应用日趋流行。在某些Web应用系统中,需直接上傳ZIP格式的压缩文件,并自动解压之。为此,本文提出一种可跨平台运行的解决方案,即利用PHP与PKZIP实现基于Web的ZIP文件的上传与解压。    二、技术简介  
期刊
[摘 要] 本文从交易费用的角度探讨了商业方法的本质及其与技术之间的本质区别,然后利用新兴古典经济学的基本模型分析了商业方法、技术与经济增长的辩证关系,指出商业方法能够在技术不变的情况下带来经济的跳跃性增长,因而需要用专利法对其进行保护,鼓励商业方法创新。  [关键词] 商业方法 专利保护 交易费用    一、问题的提出  鉴于商业方法的专利保护在美国、欧洲和日本都已经成为事实,既有的商业方法专利
期刊
[摘 要] 从体系结构的结构维和视图维两个角度对ERP系统体系结构的总体框架进行了研究,并且以江苏省某制药厂的库存管理业务和流程为例,对ERP系统体系结构进行了实证分析设计和应用。  [关键词] ERP 体系结构 结构维 视图维    一、引言  计算机信息技术用于管理领域的许多优势愈来愈受到每一个企业所关注,企业资源规划(ERP,Enterprise Resource Planning)作为一种
期刊
[摘要] 知识经济时代,企业越来越体现出货币资本与人力资本“共同治理”的特征,且人的因素显得更为重要。人力资本同货币资本一样作为对企业的投入,同样应该获得相应的剩余索取权。  [关键词] 人力资本 剩余索取权 资本市场    随着知识经济的到来,人力资本是现代经济增长的主要源泉,投资于人力资本的收益远远高于投资于物力资本。货币资本于人力资本合作的共同目的就是实现资本增值。人力资本作为资本家族的一员
期刊
[摘要] 本文是继《中国会计信息化进程研究综述》后,作者于美国加州大学访问学习期间对我国会计信息化前沿问题的进一步研究。文章引入了美国可扩展商业报告语言(XBRL)的概念,从他的来源及发展,特点及功用入手详细阐述了他在会计信息化领域产生深远的影响。最后,建议中国能跟上世界发展的步伐,建立自己的XBRL体系。  [关键词] XBRL XML 财务报告模式 会计信息化    当前,基于网络会计信息化的
期刊
[摘 要] 以H公司零备件用量预测的实际需要为背景,本文分别运用OLS模型和半参数模型对H公司零备件累积损坏率进行了估计与预测。结果表明,半参数模型估计和预测精度优于OLS模型,在公司实际经营中有应用前景。  [关键词] 预测 半参数模型 Weibull分布    半参数模型是参数模型和无参数模型的混合模型,即具有参数模型解释力强、可用于预测的特点,又具有无参数模型估计精度高的特性,相比较于传统的
期刊
[摘 要] 3M公司是全球最具创新性的公司,本文通过研究其创新的秘诀试图为我国企业的创新提供借鉴。3M公司创新秘诀在于其内部的创新机制能够不断激发创新和推动创新,而其创新机制主要由鼓励创新的企业文化、支持创新的管理制度与激发创新的人才管理体制所组成。  [关键词] 3M公司 创新机制    吉姆·柯林斯在其著作《基业常青》中对18个全球知名的公司进行研究,研究其成功的地方,这些公司包括沃尔玛、宝洁
期刊
[摘 要] 本文利用ASP动态网站技术,使用跨Windows和Linux平台的同一个数据库MySql,采用统一的表单界面,借用连接数据库的方法,在WEB服务器环境下,给出了电子商务网站设计中的主要的前台和后台程序。   [关键词] 电子商务网站 网络数据库 ASP 服务器    一、引言  目前动态网站设计技术主要有Perl/C++/Delphi等开发的CGI,以及3P技术(ASP、JSP、PHP
期刊
[摘 要] 本文通过中小企业利用外部资源实施虚拟经营的案例分析,诠释了中小企业发展应根据不断变化的市场环境,依靠信息化平台整合企业内外部资源,实施虚拟经营。中小企业信息化是实施虚拟经营的基础条件,应利用信息技术提高企业的管理水平,快速响应不断变化的市场需求,从而赢得竞争优势。  [关键词] 中小企业 虚拟经营 信息化    我国改革开放之后,诞生了成千上万的民营中小企业。中小企业数量众多,不断寻找
期刊
[摘 要] Linux系统使用越来越广泛,关系Linux的安全越来越受到人们的重视,本文结合笔者在Linux系统安全管理方面的一些经验体会,从账户、密码策略、文件权限,日志管理、远程访问等5个方面,对linux系统安全谈谈自己的体会,供大家参考。  [关键词] LINUX 账号 密码 日志    一、引言  随着Internet/Intranet网络的日益普及,Linux作为一个现代的操作系统,正
期刊