K—means聚类算法在建筑材料租赁客户利润中的应用

来源 :知音励志·教育版 | 被引量 : 0次 | 上传用户:shi12345600
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文设计的建筑材料租赁系统,管理者可以利用数据挖掘技术中K-means聚类算法找出不同类别的客户,并针对不同的客户给予不同的优惠措施,这样可以让租赁站管理者了解自己的客户类型,并采取不同的租赁措施。
  【关键词】计算机系统;建筑材料租赁;K-means算法;客户利润
  现在,全国有上千多家钢模板厂家,钢模板业也逐渐发展为成熟且稳定的行业。建筑材料租赁系统,是以提高建材租赁公司的效率为基础,避免了浪费租赁站的各种纸张、打印等资源,从而降低租赁站的成本;管理者通过租赁系统软件,产生并保存了合同、基本资料等相关资源,避免许多人工方式下的工作劳动,很大程度上提高了租赁站的工作效率。
  红兴模板租赁站位于某市,是一个小型的租赁站,经过自身的努力和发展,具备了相当的经济实力和一定的经营规模。租赁站主要租赁模板、扣件、钢管等建筑材料,租赁业务遍布各地,由于其信誉良好,态度真诚,租赁业务蒸蒸日上。
  目前红兴租赁站主要通过书面报告、口头汇报等方式收集数据,管理者回到家后,便不能对租赁业务的相关数据进行处理,因此,工作效率较低下,另外,管理者对自己的各种客户也没有进行深入的分析。因此,开发建筑材料租赁系统,是为提高租赁站管理者的工作效率,并借助网络和计算机对每天的租赁业务进行信息化管理,进而提高工作效率。
  在租赁站长年累月积累数据中,隐藏着许多为管理者决策提供支持的信息。利用数据挖掘中的分类算法可以预测未来的数据趋势的模型。分类算法中的K-means算法在当前应用较为广泛。该算法不使用目标字段,是一种无监督学习的方法。租赁业务中,可以用K-means算法對租赁客户的利润进行分析,样本的分布情况见表1。
  假设k=3,将103、105和108作为初始簇的中心,先对表1中的数据进行规格化,如表2所示。
  初始化三个簇的中心为A:{0.33, 0.67, 0.5},B:{1, 1, 1}和C:{0.33,0.33, 0.24}。接着计算所有客户各对这三个中心点的相异度。
  101与A点的距离:
  d(x,y)=
  =0.37
  101与B点的距离:
  d(x,y)=
  =0.57
  101与C点的距离:
  d(x,y)=
  =0.57
  同理,再计算其余客户各到三个点的距离,如下:
  102客户:与A点的距离0.9,与B点的距离1.73,与C点的距离0.52
  103客户:与A点的距离0,与B点的距离0.9,与C点的距离0.43
  104客户:与A点的距离0.74,与B点的距离1.57,与C点的距离0.37
  105客户:与A点的距离0.9,与B点的距离0,与C点的距离1.21
  106客户:与A点的距离0.52,与B点的距离0.61,与C点的距离0.71
  107客户:与A点的距离0.31,与B点的距离0.61,与C点的距离0.69
  108客户:与A点的距离0.43,与B点的距离1.21,与C点的距离0.01
  将上述每个客户按规则分到最近的簇,并做如下聚类:
  客户101聚到A,客户102聚到C,客户103聚到A,客户104聚到C,客户105聚到B,客户106聚到A,客户107聚到A,客户108聚到C。
  于是,得到了第一次的聚类结果:
  A:101,103,106,107;
  B:105;
  C:102,104,108。
  再根据上边的结果,再次调整各个簇的中心点。
  A簇新的中心点计算过程和结果如下:
  {(0.67+0.33+0.83+0.5)/4=0.582 5,(0.78+0.67+0.78+0.78)/4=0.752 5,(0.6+0.5+0.45+0.74)/4=0.572 5}={0.582 5,0.752 5,0.572 5};
  同理,计算B簇和C簇的新中心点各为{1,1,1},{0.133 3,0.146 7,0.113 3}。
  这时,再用调整后的新中心点再次进行聚类分析,得到如下结果:
  101客户:与A点的距离0.09,与B点的距离0.57,与C点的距离0.96;
  102客户:与A点的距离1.11,与B点的距离1.73,与C点的距离0.23;
  103客户:与A点的距离0.27,与B点的距离0.9,与C点的距离0.68;
  104客户:与A点的距离0.95,与B点的距离1.57,与C点的距离0.08;
  105客户:与A点的距离0.65,与B点的距离0,与C点的距离1.51;
  106客户:与A点的距离0.28,与B点的距离0.61,与C点的距离1;
  107客户:与A点的距离0.19,与B点的距离0.61,与C点的距离0. 69;
  108客户:与A点的距离0.59,与B点的距离1.21,与C点的距离0.3。
  第二次迭代后的结果为:
  客户101聚到A,客户102聚到C,客户103聚到A,客户104聚到C,客户105聚到B,客户106聚到A,客户107聚到A,客户108聚到C。
  结果并没有发生大的变化,说明聚类结果趋于收敛,于是我们可以给出最终的聚类结果:
  A类客户:101,103,106,107;
  B类客户:105;
  C类客户:102,104,108。
  经过上述计算过程,我们可以知道105是B类客户,此类客户产生的利润呈年年增长的趋势,幅度增长的也大;101、103、106、107是A类客户,这种客户为租赁站产生的利润也年年增长,但其创造的利润不如B类客户创造的利润多;102、104、108是C类客户,此类客户所创造的利润极稳定,也没有不是一直增长,为租赁站创造的利润也不多。如图2所示。
  基于以上详细的计算过程,租赁站将不同的租赁措施针对于三类不同的客户。对于B类最好的客户,尽可能提供价格上或其它方面的优惠;对于A类中等客户,要重点找出利润低下的原因,并采取措施让这些客户逐步增加建材租赁利润;对于C类这些不太好的客户,则重点要找出建材租赁利润不断变化的原因,争取让其先变成A类客户,再争取向B类客户迈进。
  作者简介
  张亚娜(1979-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院副教授。研究方向为系统设计与开发。
  贺宏(1979-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院副教授。 研究方向为数据库设计与开发。
  韩莉(1977-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院讲师。研究方向为数据库设计与开发。
  曹鑫(1981-),女,河北省石家庄市人。大学本科学历。现为石家庄信息工程职业学院讲师。 研究方向为系统设计与开发。
  作者单位
  石家庄信息工程职业学院 河北省石家庄市 050035
其他文献
当前有不少企业特别是有些合资企业实行层层控制,层层加压,严格的等级管理,职工的合理休息得不到保证,且长时间封闭作业,劳动保护及安全条件达不到规定要求,一度出现不少职
Foamed combustible material based on polymer bonded RDX was fabricated using CO_2 as foaming agent.The inner structures of felted and foamed combustible materia
心理学家迪西(Deci,E.L)做过一个实验,让一些学生解答妙趣横生的智力难题。开始时对所有学生都不奖励,接着把他们分成两组,其中一组学生每解答完一个智力难题,就给予一定的
系统梳理目前国内外环境设计专业的教育现状,深入剖析环境设计专业人才培养规律和当前趋势下对创新性专业人才需求,提出指向“以设计创新为核心”的环境设计专业人才培养模式
安徽省慈溪市观城东山头小学加强德育工作近年来,该校把德育工作摆在突出的位置,从学校的实际出发,努力摸索德育的新路子。主要做法是:(1)坚持每周一的升旗仪式。校长亲自致辞,对学生
同志们: 首先,让我代表劳动部向我国第一批高级技师表示热烈的祝贺!借此机会,也向辛勤劳动在生产第一线的技师和广大的工人同志们表示亲切的慰问! 自1987年国务院批准《关于
绍政办发〔2016〕34号各区、县(市)人民政府,市政府各部门、各单位:《绍兴市危险废物处置监管三年行动计划(2016—2018年)》已经市政府同意,现印发给你们,请结合实际,认真贯
义务教育六年制小学课本第一册中应用题的编排注意了由易到难,循序渐进,减小坡度,加强力度。一年级应用题的启蒙教学,直接关系到以后各年级应用题教学质量的高低。为了打好
肝胆动态显像可以反映肝胆系统摄取、排泄功能,为临床手术及疗效观察提供客观依据。肝胆显像视觉分析方法虽简便易行,可以直观肝胆系统吸收与排泄的动态变化,但易受图像条件变化
萍乡电大在线是萍乡广播电视大学网络教学的支撑平台,已在萍乡广播电视大学运行了10年。这个基于Web的网络教学平台引入统一的身份认证与授权管理,教师、学生和管理人员从统一入口进入,根据用户身份确定用户界面和访问权限,为用户提供个性化服务。  一、系统的功能  萍乡电大在线平台的目标是在校园网上建立一个Web化的网络教学环境,教师可以开展网上教学的各项活动,包括布置与批改作业、上传教学资源、非实时交互