论文部分内容阅读
目前,网络购物已经逐步成熟,用户规模不断壮大。与之相对应的网络商城和网络商家也得到了较大的发展。本文基于网络商铺客户忠诚度的基本理念,运用数据挖掘技术,讨论了在网络商城中的网络商铺的客户稳定性问题。文章首先确定了描述网络商铺状态、商品的多种因素作为网络商城中商铺的发展评价指标;并采用三分法,将各个属性的原始数据进行统一处理,完成属性数据的标准化和统一化;最后利用数据挖掘中的决策树ID3算法对影响商铺稳定性的各种因素、属性进行挖掘,最终确定了对商铺的客户稳定性影响最为直接的四项属性指标:包括收藏人气、物流服务质量、商铺的卖家信用度以及以往客户的商品评价。在利用ID3算法进行挖掘的过程中,为了去除属性值个数对信息增益量的影响,同时也为了对收集到的网络商城中商铺的各项属性数据进行标准化,本文通过对各属性值进行差值均分的办法,利用各属性的最小值与最大值之间的差值进行三等分,将所有的属性分为了三种取值:高、中、低,既避免了ID3算法对属性值数量的依赖,同时也使得各种不同规格的数据具有了统一的表达形式,也满足了ID3算法的计算要求。而且,通过运用三分法,将复杂的属性取值变得更为简单,极大地降低了计算量。在处理更为复杂问题的时候,可以较大地提高计算效率。之后通过运用基于SQL server的商业智能挖掘平台BIDS的数据挖掘,构造了基于网络商城中相关商铺及商品属性指标的、描述客户稳定性的客户分类决策树。客户分类决策树刻画了客户稳定性与相关商铺、商品的属性指标的相关关系。利用客户分类决策树,可以对其他商品的客户稳定性进行分类。根据客户稳定性指标与商铺、及商铺商品属性的关系,挖掘的结果也为有效、定量地对顾客无法直接接触到的网络商店及商品的综合评价提供了一种较为客观的评价视角,同时也为各个网上商城等电商平台对商铺的管理、为网络商店自身的发展、为消费者对商铺进行评价提供了具体的参考。