论文部分内容阅读
本文设计的建筑材料租赁系统,管理者可以利用数据挖掘技术中K-means聚类算法找出不同类别的客户,并针对不同的客户给予不同的优惠措施,这样可以让租赁站管理者了解自己的客户类型,并采取不同的租赁措施。
【关键词】计算机系统;建筑材料租赁;K-means算法;客户利润
现在,全国有上千多家钢模板厂家,钢模板业也逐渐发展为成熟且稳定的行业。建筑材料租赁系统,是以提高建材租赁公司的效率为基础,避免了浪费租赁站的各种纸张、打印等资源,从而降低租赁站的成本;管理者通过租赁系统软件,产生并保存了合同、基本资料等相关资源,避免许多人工方式下的工作劳动,很大程度上提高了租赁站的工作效率。
红兴模板租赁站位于某市,是一个小型的租赁站,经过自身的努力和发展,具备了相当的经济实力和一定的经营规模。租赁站主要租赁模板、扣件、钢管等建筑材料,租赁业务遍布各地,由于其信誉良好,态度真诚,租赁业务蒸蒸日上。
目前红兴租赁站主要通过书面报告、口头汇报等方式收集数据,管理者回到家后,便不能对租赁业务的相关数据进行处理,因此,工作效率较低下,另外,管理者对自己的各种客户也没有进行深入的分析。因此,开发建筑材料租赁系统,是为提高租赁站管理者的工作效率,并借助网络和计算机对每天的租赁业务进行信息化管理,进而提高工作效率。
在租赁站长年累月积累数据中,隐藏着许多为管理者决策提供支持的信息。利用数据挖掘中的分类算法可以预测未来的数据趋势的模型。分类算法中的K-means算法在当前应用较为广泛。该算法不使用目标字段,是一种无监督学习的方法。租赁业务中,可以用K-means算法對租赁客户的利润进行分析,样本的分布情况见表1。
假设k=3,将103、105和108作为初始簇的中心,先对表1中的数据进行规格化,如表2所示。
初始化三个簇的中心为A:{0.33, 0.67, 0.5},B:{1, 1, 1}和C:{0.33,0.33, 0.24}。接着计算所有客户各对这三个中心点的相异度。
101与A点的距离:
d(x,y)=
=0.37
101与B点的距离:
d(x,y)=
=0.57
101与C点的距离:
d(x,y)=
=0.57
同理,再计算其余客户各到三个点的距离,如下:
102客户:与A点的距离0.9,与B点的距离1.73,与C点的距离0.52
103客户:与A点的距离0,与B点的距离0.9,与C点的距离0.43
104客户:与A点的距离0.74,与B点的距离1.57,与C点的距离0.37
105客户:与A点的距离0.9,与B点的距离0,与C点的距离1.21
106客户:与A点的距离0.52,与B点的距离0.61,与C点的距离0.71
107客户:与A点的距离0.31,与B点的距离0.61,与C点的距离0.69
108客户:与A点的距离0.43,与B点的距离1.21,与C点的距离0.01
将上述每个客户按规则分到最近的簇,并做如下聚类:
客户101聚到A,客户102聚到C,客户103聚到A,客户104聚到C,客户105聚到B,客户106聚到A,客户107聚到A,客户108聚到C。
于是,得到了第一次的聚类结果:
A:101,103,106,107;
B:105;
C:102,104,108。
再根据上边的结果,再次调整各个簇的中心点。
A簇新的中心点计算过程和结果如下:
{(0.67+0.33+0.83+0.5)/4=0.582 5,(0.78+0.67+0.78+0.78)/4=0.752 5,(0.6+0.5+0.45+0.74)/4=0.572 5}={0.582 5,0.752 5,0.572 5};
同理,计算B簇和C簇的新中心点各为{1,1,1},{0.133 3,0.146 7,0.113 3}。
这时,再用调整后的新中心点再次进行聚类分析,得到如下结果:
101客户:与A点的距离0.09,与B点的距离0.57,与C点的距离0.96;
102客户:与A点的距离1.11,与B点的距离1.73,与C点的距离0.23;
103客户:与A点的距离0.27,与B点的距离0.9,与C点的距离0.68;
104客户:与A点的距离0.95,与B点的距离1.57,与C点的距离0.08;
105客户:与A点的距离0.65,与B点的距离0,与C点的距离1.51;
106客户:与A点的距离0.28,与B点的距离0.61,与C点的距离1;
107客户:与A点的距离0.19,与B点的距离0.61,与C点的距离0. 69;
108客户:与A点的距离0.59,与B点的距离1.21,与C点的距离0.3。
第二次迭代后的结果为:
客户101聚到A,客户102聚到C,客户103聚到A,客户104聚到C,客户105聚到B,客户106聚到A,客户107聚到A,客户108聚到C。
结果并没有发生大的变化,说明聚类结果趋于收敛,于是我们可以给出最终的聚类结果:
A类客户:101,103,106,107;
B类客户:105;
C类客户:102,104,108。
经过上述计算过程,我们可以知道105是B类客户,此类客户产生的利润呈年年增长的趋势,幅度增长的也大;101、103、106、107是A类客户,这种客户为租赁站产生的利润也年年增长,但其创造的利润不如B类客户创造的利润多;102、104、108是C类客户,此类客户所创造的利润极稳定,也没有不是一直增长,为租赁站创造的利润也不多。如图2所示。
基于以上详细的计算过程,租赁站将不同的租赁措施针对于三类不同的客户。对于B类最好的客户,尽可能提供价格上或其它方面的优惠;对于A类中等客户,要重点找出利润低下的原因,并采取措施让这些客户逐步增加建材租赁利润;对于C类这些不太好的客户,则重点要找出建材租赁利润不断变化的原因,争取让其先变成A类客户,再争取向B类客户迈进。
作者简介
张亚娜(1979-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院副教授。研究方向为系统设计与开发。
贺宏(1979-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院副教授。 研究方向为数据库设计与开发。
韩莉(1977-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院讲师。研究方向为数据库设计与开发。
曹鑫(1981-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院讲师。 研究方向为系统设计与开发。
作者单位
石家庄信息工程职业学院 河北省石家庄市 050035
【关键词】计算机系统;建筑材料租赁;K-means算法;客户利润
现在,全国有上千多家钢模板厂家,钢模板业也逐渐发展为成熟且稳定的行业。建筑材料租赁系统,是以提高建材租赁公司的效率为基础,避免了浪费租赁站的各种纸张、打印等资源,从而降低租赁站的成本;管理者通过租赁系统软件,产生并保存了合同、基本资料等相关资源,避免许多人工方式下的工作劳动,很大程度上提高了租赁站的工作效率。
红兴模板租赁站位于某市,是一个小型的租赁站,经过自身的努力和发展,具备了相当的经济实力和一定的经营规模。租赁站主要租赁模板、扣件、钢管等建筑材料,租赁业务遍布各地,由于其信誉良好,态度真诚,租赁业务蒸蒸日上。
目前红兴租赁站主要通过书面报告、口头汇报等方式收集数据,管理者回到家后,便不能对租赁业务的相关数据进行处理,因此,工作效率较低下,另外,管理者对自己的各种客户也没有进行深入的分析。因此,开发建筑材料租赁系统,是为提高租赁站管理者的工作效率,并借助网络和计算机对每天的租赁业务进行信息化管理,进而提高工作效率。
在租赁站长年累月积累数据中,隐藏着许多为管理者决策提供支持的信息。利用数据挖掘中的分类算法可以预测未来的数据趋势的模型。分类算法中的K-means算法在当前应用较为广泛。该算法不使用目标字段,是一种无监督学习的方法。租赁业务中,可以用K-means算法對租赁客户的利润进行分析,样本的分布情况见表1。
假设k=3,将103、105和108作为初始簇的中心,先对表1中的数据进行规格化,如表2所示。
初始化三个簇的中心为A:{0.33, 0.67, 0.5},B:{1, 1, 1}和C:{0.33,0.33, 0.24}。接着计算所有客户各对这三个中心点的相异度。
101与A点的距离:
d(x,y)=
=0.37
101与B点的距离:
d(x,y)=
=0.57
101与C点的距离:
d(x,y)=
=0.57
同理,再计算其余客户各到三个点的距离,如下:
102客户:与A点的距离0.9,与B点的距离1.73,与C点的距离0.52
103客户:与A点的距离0,与B点的距离0.9,与C点的距离0.43
104客户:与A点的距离0.74,与B点的距离1.57,与C点的距离0.37
105客户:与A点的距离0.9,与B点的距离0,与C点的距离1.21
106客户:与A点的距离0.52,与B点的距离0.61,与C点的距离0.71
107客户:与A点的距离0.31,与B点的距离0.61,与C点的距离0.69
108客户:与A点的距离0.43,与B点的距离1.21,与C点的距离0.01
将上述每个客户按规则分到最近的簇,并做如下聚类:
客户101聚到A,客户102聚到C,客户103聚到A,客户104聚到C,客户105聚到B,客户106聚到A,客户107聚到A,客户108聚到C。
于是,得到了第一次的聚类结果:
A:101,103,106,107;
B:105;
C:102,104,108。
再根据上边的结果,再次调整各个簇的中心点。
A簇新的中心点计算过程和结果如下:
{(0.67+0.33+0.83+0.5)/4=0.582 5,(0.78+0.67+0.78+0.78)/4=0.752 5,(0.6+0.5+0.45+0.74)/4=0.572 5}={0.582 5,0.752 5,0.572 5};
同理,计算B簇和C簇的新中心点各为{1,1,1},{0.133 3,0.146 7,0.113 3}。
这时,再用调整后的新中心点再次进行聚类分析,得到如下结果:
101客户:与A点的距离0.09,与B点的距离0.57,与C点的距离0.96;
102客户:与A点的距离1.11,与B点的距离1.73,与C点的距离0.23;
103客户:与A点的距离0.27,与B点的距离0.9,与C点的距离0.68;
104客户:与A点的距离0.95,与B点的距离1.57,与C点的距离0.08;
105客户:与A点的距离0.65,与B点的距离0,与C点的距离1.51;
106客户:与A点的距离0.28,与B点的距离0.61,与C点的距离1;
107客户:与A点的距离0.19,与B点的距离0.61,与C点的距离0. 69;
108客户:与A点的距离0.59,与B点的距离1.21,与C点的距离0.3。
第二次迭代后的结果为:
客户101聚到A,客户102聚到C,客户103聚到A,客户104聚到C,客户105聚到B,客户106聚到A,客户107聚到A,客户108聚到C。
结果并没有发生大的变化,说明聚类结果趋于收敛,于是我们可以给出最终的聚类结果:
A类客户:101,103,106,107;
B类客户:105;
C类客户:102,104,108。
经过上述计算过程,我们可以知道105是B类客户,此类客户产生的利润呈年年增长的趋势,幅度增长的也大;101、103、106、107是A类客户,这种客户为租赁站产生的利润也年年增长,但其创造的利润不如B类客户创造的利润多;102、104、108是C类客户,此类客户所创造的利润极稳定,也没有不是一直增长,为租赁站创造的利润也不多。如图2所示。
基于以上详细的计算过程,租赁站将不同的租赁措施针对于三类不同的客户。对于B类最好的客户,尽可能提供价格上或其它方面的优惠;对于A类中等客户,要重点找出利润低下的原因,并采取措施让这些客户逐步增加建材租赁利润;对于C类这些不太好的客户,则重点要找出建材租赁利润不断变化的原因,争取让其先变成A类客户,再争取向B类客户迈进。
作者简介
张亚娜(1979-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院副教授。研究方向为系统设计与开发。
贺宏(1979-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院副教授。 研究方向为数据库设计与开发。
韩莉(1977-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院讲师。研究方向为数据库设计与开发。
曹鑫(1981-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院讲师。 研究方向为系统设计与开发。
作者单位
石家庄信息工程职业学院 河北省石家庄市 050035