基于SOM聚类的数据挖掘方法及其应用研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:cyddvd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
论文讨论了数据可视化技术,自组织图(Self-Organizing Map,简称SOM),在聚类中的应用。提出了两种聚类算法以及一种基于SOM聚类的数据挖掘过程,并将算法在电信客户分群中进行了应用。论文研究工作主要包括以下几个方面:1、介绍了数据挖掘技术、数据可视化技术及其研究进展。重点描述了SOM算法实现过程,以及各种SOM变体的基本原理。同时对电信数据挖掘进行了简单的探讨,指出利用数据挖掘帮助电信行业进行信息提取的重要意义。2、针对传统聚类算法在确定聚类类别数方面所存在的问题:无先验知识所导致的盲目性以及繁杂统计指标的难理解性,提出一种基于SOM的可视化聚类算法VC-SOM,利用SOM网络数据集的聚簇分布特征,进而确定聚类类别数。并进行了仿真研究,获得了较满意的结果。3、针对多数聚类算法偏向于发现超球形、大小均匀聚类的问题,提出一种基于SOM的多中心聚类算法MCC-SOM,利用SOM网络获取数据集所包含的类别数,以及各个类的相对大小、位置等信息,并利用这些信息设计一个二维SOM聚类网络,用多个输出节点作为一个聚类的代表点,以反映出聚类的形状、大小以及相对位置。最后进行了仿真研究,或得了满意的结果。4、将基于SOM的聚类算法应用于电信行业客户分群问题,提出一种基于SOM聚类的数据挖掘算法。将可视化思想贯穿于整个聚类过程中,在提高聚类效率,改善聚类效果的同时,挑选出对聚类起主要作用的属性(聪明属性),并对聚类结果作出合理解释。最后利用某电信公司的客户行为数据进行客户分群分析,得到了较满意的分群结果,在此基础上采用单变量统计分析的方法对分群结果进行分析,给出每个客户群的特征刻画,在此基础上提出了相应的营销建议。在论文最后对所作的研究工作进行了总结。讨论了算法的优缺点,并针对算法缺点指出可能的解决途径,拟定下一步有待开展的研究工作。另外就论文所提出的聚类算法的一些优点在其他领域的应用价值进行了讨论,指出了一个有一定实际意义的研究方向。
其他文献
一、桂单08101.审定编号:桂审玉2012008号。2.品种名称:桂单0810。3.选育单位:广西农科院玉米研究所,广西兆和种业有限公司。4.特征特性:生育期春季平均120天,秋季平均110天,幼苗长势中
近年来,国家大力推行城市综合管廊建设,综合管廊设计逐渐引起关注。文章以某地下综合管廊为例,采用两种常用的管廊平面计算模型:地基反力直线分布模型和弹性地基模型,分析计
束流检测是加速器调试和运行的重要诊断手段,本设计通过变压器隔离输入、提高输入阻抗、利用锁定放大器来剔除干扰信号、以及触发电路应用CD4098使脉冲宽展构成束流检测电路,
在黄土隧道施工过程中,经常会遇到强度高于10MPa的泥岩,常规挖掘机械开挖速度慢。文中依托宝兰客专14标古城岭隧道和兰山隧道,通过现场试验对比钻爆法、破碎锤和铣挖机开挖,
对2008-2009赛季NBA总决赛两支球队五场比赛的技术情况、录像资料和有关的赛事报道进行分析、推理,并归纳出两队胜败的原因,从而揭示各自存在的不足,同时也为NBA其他球队的学
中西医结合对过敏性休克的抢救及护理体会肖大招(江西省吉安市第一人民医院343000)关键词过敏性休克,中西医结合疗法过敏性休克是由于一般对人无害的特异性过敏原作用于过敏病人,导致以
为了区域装备制造业信息化建设,研究和设计了装备制造业产业协作服务平台的整体架构,分为三个层次:数据共享层、应用服务层和用户层.研究了服务平台功能模型,定义了服务平台
从供给侧改革的角度,分析了全民阅读经过10年发展后存在的主要问题,包括有效供给不足、供给结构失衡、无效供给过剩、供给方式脱节等。供给侧结枷『生l改革的目的在于扩大有效
本文主要分析中文语境下的版式设计基本特点、于西方和日本的主要区别,继而探究中文语境下的版式设计创新。以经典版式设计理论和中文语境相结合,总结出一套适用性较强的中文
近年来,城市化进程加快,乡村发展迅速,导致了乡土景观的破坏与文化的断裂。这一过程中,越来越多的乡土景观收到了外来文化的冲击,被外来文化所替代。不仅如此,由于缺乏传统的