聚类分析及其在客户细分中的应用研究

来源 :中国地质大学(武汉) | 被引量 : 0次 | 上传用户：holyturtle

【摘要】

：

随着计算机科学与技术的普及和应用，特别是近年来，数据库技术和信息技术的蓬勃发展，人们产生和收集了大量的数据，但是如何从中发现有价值的信息，达到为决策服务的目的，成为了一个非

【作者】

：

李金磊

【机构】

：

中国地质大学(武汉)

【出处】

：

中国地质大学(武汉)

【发表日期】

：

2007年期

【关键词】

：

聚类分析聚类融合数据挖掘企业客户细分投票策略 Co-association矩阵

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着计算机科学与技术的普及和应用，特别是近年来，数据库技术和信息技术的蓬勃发展，人们产生和收集了大量的数据，但是如何从中发现有价值的信息，达到为决策服务的目的，成为了一个非常艰巨的任务。于是数据挖掘技术应运而生，并显示出其强大的生命力，从而逐渐成为研究的热点。数据挖掘(Data Mining)，又称为数据库中的知识发现(简称KDD)，是从大量数据中提取或者“挖掘”知识的一个过程，而聚类分析是数据挖掘研究领域中一个非常重要的研究方向。所谓的聚类就是对数据集中的数据应用某种方法进行分组，使得每组内部的数据尽可能相似而不同组之间的数据尽可能不同，从而发现数据集内在的结构特征。聚类分析已经广泛地运用在许多领域，包括模式识别、数据分析、图象处理以及市场研究等。通过聚类，人们能识别密集的和稀疏的区域，从而发现全局的分布模式及数据属性之间的相互关系。在目前的许多领域活动中，多数情况是无先验规律的，数据划分的类是未知的，信息的整理、分析和知识转化是一个无监督的过程，因而聚类分析就拥有了广阔的市场，但目前聚类分析技术无论在理论研究还是实际应用中都还不成熟，有待进行更深入的研究。 21世纪将是一个“客户经济”的时代，企业的经营理念正在由“以市场为中心”向“以客户为中心”转变。实际运作中，企业很快就发现并非所有的客户都能为企业带来利润。市场分析理论认为，企业80％的利润来源于20％的客户。因此，这就要求企业挖掘客户价值数据，掌握客户的行为规律，并运用于企业决策中。国外一些优秀的企业已经开始注意数据挖掘技术在这方面的应用，但在国内，无论是客户关系管理还是数据挖掘技术的应用，都还处于起步阶段。目前的研究多集中在数据挖掘算法的研究、改进和实现上，而将数据挖掘技术应用于客户价值挖掘方面的工作却很少。本文从研究数据挖掘聚类分析的基本算法入手，详细介绍了现有的经典聚类分析算法，并阐述了近年来才开始研究的聚类融合算法的基本思想及关键问题。在此基础上，提出了基于投票策略的聚类融合算法，并结合加权的思想和随机划分属性子空间的方法对算法作进一步的改进。随后，研究并实现了基于Co-association矩阵的聚类融合算法，同时引入随机划分属性子空间和随机划分样本子空间的方法对算法加以改进，实验结果进一步证明了聚类融合方法的优越性。最后，本文采用iava技术设计实现了一个客户细分原型系统，成功运用以上聚类分析算法对客户价值进行挖掘研究，对客户进行细分，从而找出各类客户的特征，为企业相关的经营活动提供有益的帮助。具体地，论文主要内容有： (1)系统综述了聚类算法特别是聚类融合算法的国内外研究现状，总结了聚类算法在客户细分领域的相关研究，指出了目前研究中存在的主要问题。 (2)简要介绍了聚类分析的基本概念及其产生和发展过程，详细讨论了聚类分析中经常出现的数据类型及其预处理方法，总结分析了传统的聚类算法，进而重点阐述了聚类融合算法的基本思想，并详细分析了聚类融合算法中的两个关键问题。 (3)以K-means算法作为基础算法，提出了基于投票策略的聚类融合算法和基于Co-aSsociation矩阵的聚类融合算法的一个变种算法。进一步地，在基于投票策略的聚类融合算法中引入加权和划分属性子空间的方法，在基于co-association矩阵的聚类融合算法中引入划分属性子空间和划分样本子空间的方法，并通过实验结果比较，证明了聚类融合方法的高效性和有效性。 (4)成功地将本文提出的聚类融合算法应用于客户细分中，详细讨论了从客户数据的选取、客户细分原型系统的设计，到不同算法的实验结果与分析的过程，并论述了不同类别客户的服务策略。

其他文献

面向印刷体识别的后处理方法

本论文对印刷体识别后处理技术进行了深入的研究,目标就是从理论,算法和应用三个层次上研究如何校正文本图像识别错误,提高系统识别率.研究工作主要包括以下几个方面: 首

学位

印刷体识别后处理方法HMM模型相似字不对称性

基于S1000D规范的IETM生成技术研究与实现

在当今世界上,科学技术的发展日新月异,各类设备功能逐步强大,随之导致复杂程度迅速提升。这些设备的设计、研发、使用、维修等方面的技术资料也长年累积,数量之大令人头疼。

学位

IETMS1000DXML数据管理故障维修

面向曙光5000的SERDES接收端高速CDR电路设计

通过电荷泵锁相环原理实现的高速CMOS数据和时钟恢复(CDR)电路是目前比较普遍的设计方法.本文研究了这种CDR电路的相关设计问题,内容涉及以下几个方面. 首先,解释电荷泵锁

学位

时钟数据恢复电荷泵锁相环相位噪声差分环型振荡器线性鉴相器

蓝鲸集群文件系统Windows客户端的性能优化研究

随着集群技术和网络技术的飞速发展,网络存储系统成为解决集群I/O性能瓶颈的主要手段之一.集群文件系统作为网络存储系统的核心技术,很好地解决了传统文件系统中存在的性能、

学位

集群文件系统BWFS客户端性能优化

PSIM模拟器性能优化技术研究

在计算机技术发展过程中,模拟一直是一个重要的研究方法.模拟器由于其灵活性,被广泛用于体系结构研究、系统软件的开发和调试、复杂应用程序的性能评测以及软件的移植等诸多

学位

模拟器性能优化穿线码二进制翻译

分辨率自适应的视频编码研究

视频压缩的国际标准近年来得到了迅速的发展,但是编码性能的提高仍然有较大的空间.特别是随着无线网络与手持设备的发展,实现低带宽下高质量的视频压缩具有重要的意义.这些应

学位

分辨率自适应下采样插值视频编码自适应系数扫描视频压缩

聚芯SoC验证平台的设计与实现

随着集成电路技术的快速发展,工艺特征尺寸不断减小,产品的性能不断提高,在单一芯片上实现全部系统功能的SoC (System on a Chip,系统级芯片)设计技术也己经逐渐走向成熟.SoC

学位

聚芯SoC验证平台约束随机断言验证功能覆盖率

视频监控中运动目标轨迹分析研究

目标轨迹分析是计算机视觉的一个重要问题，涉及到模式识别与智能系统、图像处理、统计学、机器学习等多个领域内容。经过近二十年深入的研究和发展，目标轨迹分析技术已经在安防

学位

视频监控运动目标运行轨迹图像分类

Dixon结式的并行计算

非线性代数方程组的求解是一个基本而重要的问题，很多实际问题最终都可以转化为非线性代数方程组的求解问题。在现代计算机代数领域中，求解非线性方程组一般有三种方法：Groebner

学位

Dixon结式数值计算稀疏插值稠密插值并行计算非线性方程组计算机软件

基于社会媒体的公众社会心态感知关键技术研究

社会心态是一段时间内弥散在整个社会或社会群体中的宏观社会心境状态，是整个社会的情绪基调、社会共识和社会价值取向的总和。当前对心态感知方法，以主观自评的问卷调查方法为

学位

用户网络行为多模态特征社会心态感知社会媒体

聚类分析及其在客户细分中的应用研究

与本文相关的学术论文