【摘 要】
:
随着科技的不断发展,网络技术和数据库技术得到广泛的应用,企业存储的数据量也急剧上升。虽然企业拥有着大量的客户数据,但却无法从海量数据中提取蕴藏在其中的商业信息。如
论文部分内容阅读
随着科技的不断发展,网络技术和数据库技术得到广泛的应用,企业存储的数据量也急剧上升。虽然企业拥有着大量的客户数据,但却无法从海量数据中提取蕴藏在其中的商业信息。如何能从数据中找出规律和模式,获取商业信息,帮助企业更好的进行决策支持成了当前研究的热门话题。客户关系管理(CRM)是企业的一种商业策略。而客户细分则是CRM的首要问题,将聚类技术运用到客户细分中,能够为企业进行客户分析提供更多有价值的信息。K-means算法是主要的聚类算法之一,它是一种基于划分的聚类算法。本文在对该算法研究的基础上,试图将该算法进行改进。同时在算法应用方面,将聚类技术应用于客户细分,客户细分是企业能够进行有效客户管理的前提和依据,因此这方面的研究具有实际指导意义。本文的主要研究工作有以下几个方面:本文分析了聚类技术的概念、功能、流程以及常用算法的优缺点,重点探讨了K-means算法的相关理论以及算法的优缺点,同时针对该算法的缺点提出了一种改进的K-means算法。首先针对K-means算法度量函数的单一性引入了度量函数规则,使算法能够针对不同的数据集选择相应的度量函数。其次针对算法对初始聚类中心敏感以及无法确定k值的问题,引入轮廓系数以及最大距离函数的方法来确定k值及初始聚类中心,从而得到了一个稳定的聚类结果。通过仿真实验证明了算法的可行性和有效性。文章最后介绍了客户细分的相关概念和细分方法,并将传统的K-means算法与改进的K-means算法应用到客户细分当中,通过对两种算法的细分结果进行比较分析,验证了改进的K-means算法能有效的增强聚类效果,在实际应用中是可行的。
其他文献
随着互联网技术的发展,XML作为信息存储和数据交换的标准被广泛采用,由于客观世界的复杂性,不确定数据存在于一些应用领域。通常不确定信息以概率值的形式在XML文档中表示,这
随着Internet的快速发展,网络入侵的手段和方法也越来越复杂,网络的安全形势日益严峻。入侵检测系统作为保护网络安全的第二道屏障,其技术也在不断地进步。借鉴生物免疫系统
本文致力于利用流量特征,设计面向入侵检测的流量选择方法进而构造与之相适应的DIDS系统,以解决主干网中IDS处理性能跟不上网络链路速度快速增长的问题。研究内容主要分为如下
网络模拟技术作为研究网络性能、设计网络方案所不可缺少的工具,得到了越来越多的重视。而在网络模拟研究中,路由策略是影响网络模拟性能最为重要的因素,如何在有限的硬件资
随着全球经济的高速发展,社会对交通运输需求持续增长,交通问题已成为世界各地城市,尤其是大城市面临的首要问题之一。近年来,随着智能交通系统的开发和无线传感器网络的研究
运用目标提取算法从连续视频图像中提取并优化运动目标,是运动跟踪、目标识别、视频监控、视频摘要、三维重建等问题的关键环节,由于其广泛的应用及本身的复杂性,运动目标检
汽轮机作为火力发电厂重要的大型旋转机械,处于生产环节中的关键地位,对其安全性和可靠性有很高的要求。为了保障汽轮机组的正常运行,汽轮机监测保护装置(TSI,Turbine Supervisory Instrumentation)在机组的保护中正在被越来越广泛的使用,由此可见,监测保护装置是否可靠在很大程度上也决定了汽轮机组的运行情况。目前汽轮机监测保护装置卡件的定期校验需要拆解送到实验室来进行,并且
近年来,随着高性能移动终端设备的普及,人们已经习惯将文档、音乐、视频等文件存放在自己的手持设备中。因此,如何使用户随时随地的进行文件共享,实现P2P (Peer to Peer)技术
集成学习使用多个学习器来解决同一问题,能够显著提高学习系统的泛化能力,成为近年来机器学习领域中一个重要的研究方向。尽管集成学习的经典算法族Boosting和Bagging已经研
最优化问题广泛存在于人类社会的生产与生活中,随着科学技术的发展以及相关问题复杂度的提高,人们对优化技术也提出了更高的要求。微粒群优化算法(Particle Swarm Optimizati