论文部分内容阅读
论文讨论了数据可视化技术,自组织图(Self-Organizing Map,简称SOM),在聚类中的应用。提出了两种聚类算法以及一种基于SOM聚类的数据挖掘过程,并将算法在电信客户分群中进行了应用。论文研究工作主要包括以下几个方面:1、介绍了数据挖掘技术、数据可视化技术及其研究进展。重点描述了SOM算法实现过程,以及各种SOM变体的基本原理。同时对电信数据挖掘进行了简单的探讨,指出利用数据挖掘帮助电信行业进行信息提取的重要意义。2、针对传统聚类算法在确定聚类类别数方面所存在的问题:无先验知识所导致的盲目性以及繁杂统计指标的难理解性,提出一种基于SOM的可视化聚类算法VC-SOM,利用SOM网络数据集的聚簇分布特征,进而确定聚类类别数。并进行了仿真研究,获得了较满意的结果。3、针对多数聚类算法偏向于发现超球形、大小均匀聚类的问题,提出一种基于SOM的多中心聚类算法MCC-SOM,利用SOM网络获取数据集所包含的类别数,以及各个类的相对大小、位置等信息,并利用这些信息设计一个二维SOM聚类网络,用多个输出节点作为一个聚类的代表点,以反映出聚类的形状、大小以及相对位置。最后进行了仿真研究,或得了满意的结果。4、将基于SOM的聚类算法应用于电信行业客户分群问题,提出一种基于SOM聚类的数据挖掘算法。将可视化思想贯穿于整个聚类过程中,在提高聚类效率,改善聚类效果的同时,挑选出对聚类起主要作用的属性(聪明属性),并对聚类结果作出合理解释。最后利用某电信公司的客户行为数据进行客户分群分析,得到了较满意的分群结果,在此基础上采用单变量统计分析的方法对分群结果进行分析,给出每个客户群的特征刻画,在此基础上提出了相应的营销建议。在论文最后对所作的研究工作进行了总结。讨论了算法的优缺点,并针对算法缺点指出可能的解决途径,拟定下一步有待开展的研究工作。另外就论文所提出的聚类算法的一些优点在其他领域的应用价值进行了讨论,指出了一个有一定实际意义的研究方向。