基于多核函数FCM算法在数据挖掘聚类中的应用研究

来源 :昆明理工大学 | 被引量 : 3次 | 上传用户:zcysun618
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术作为数据间隐含信息提取、复杂关系发现及潜在价值评估的重要工具,近年来已经成为人工智能和数据库等领域研究的热点问题。通过数据挖掘提取和发现对人们有用的、对商业决策和未来规划发展具有支撑能力和指导作用的知识和规则。聚类算法作为通过将集中的数据人为的划成若干类从而揭示数据间的真实分布的一种统计学方法及数据挖掘数据预处理阶段的重要步骤,对于人们处理数据起着重要的作用。而模糊聚类分析作为使用数学方法研究数据分类的一种方法,近年来在数据挖掘领域得到了迅猛的发展,并在模式识别、决策分析、数据分类方面获得了广泛的应用。本文对应用最为广泛、最为灵敏的算法之一的模糊C均值算法(FCM)及基于核函数FCM算法(KFCM)进行了研究分析,针对KFCM算法在网络大数据挖掘中聚类密度、大小不均衡数据集上的缺陷,对其改进算法-MKFCM算法进行了详细介绍,并将其用于实际聚类分析中。针对KFCM算法使用单一固定高斯核函数对簇间变化不敏感,不能将密度、大小不均衡的几类簇分开的不足,MKFCM算法使用了更加灵活、适用的方法,在完全无监督的方式下,将一组被分配不同分辨率权重的核函数组合构成新的核函数代替单一核函数并通过核函数间的凸关系将数据点映射到高维特征空间,再利用核函数技术实现低维空间计算。重新组合的高斯核函数可以覆盖所有数据的频谱且不同的分辨率权重又可以反映出不同簇的分布,从而可以将密度、大小不均衡的几类簇很好的分开,具有明显的优势和可靠性。仿真结果表明,相对于使用单一核函数、平均核函数的KFCM算法不能将密度、大小不均衡的簇分开,使用由被分配不同分辨率权重的核函数构成的新核函数的MKFCM算法可以将其很好分开,而不会出现簇间重叠、交叉的现象,具有更好的聚类效果和聚类精度;将MKFCM算法应用到大学校园套餐定制中,为套餐变更提供理论支撑,仿真结果表明MKFCM算法可以将密度、大小差异很大的使用流量、短信数目及语音通话的三类簇很好的分开,从而与上季度指标对比分析出套餐侧重,为新套餐制定提供决策支持,从而证明了MKFCM算法在网络大数据挖掘实际应用中的的有效性和适用性,在决策支持及未来规划上的重要指导作用,在大数据时代数据挖掘领域有很好的发展前景。
其他文献
大学生职业发展教育是促进毕业生满意就业的重要途径之一,当前我国社会各界对大学生职业发展教育非常重视。从学生自身、高校、家庭和社会四个维度来分析当代大学生职业发展
<正> 这种新型复合板材是一项专利产品,该产产品为多层纸芯板材,它具有加工方便,制作成本低,承载能力强,抗弯曲力强等特点。利用本专利的发明方案,可以生产多种复合材料。可
试验旨在研究育雏后期(3~6周龄)饲粮总含硫氨基酸(TSAA)水平对京红蛋鸡育雏期生产性能和血生化指标、育成和产蛋期生产性能的影响,以此确定京红蛋鸡育雏后期TSAA的适宜需要量
目的探讨慢性失眠症患者实施认知行为治疗的临床效果。方法对74例慢性失眠症患者随机分为认知行为治疗组(36例)和对照组(38例)。比较两组患者持续治疗4周后及2个月后随访时的
1 前言丹拉支线高速公路(天津南段)海河大桥工程全桥长2838m,主塔为双塔双索面斜拉桥,主跨径364m,边跨径152m.主塔基础承台长40.4m,宽31.02m,厚5m.主塔高140.12m,下塔柱为V型
超氧化物歧化酶(SOD)是一种超氧自由基清除剂,可用于由超氧自由基异常增高引进的各种疾病的治疗,如骨关节炎、类风湿性关节炎、放疗与化疗引进的副作用、脑损伤、再灌流综合
民主改革以来,山南地区的农业生产有了长足的发展,基本解决了群众的温饱问题,1978年粮总产达2.14亿斤,创历史最高水平。但是,由于农业基础薄弱,劳动生产力低下以及科技威力得
<正>在过去,媒体代理机构只要种好自己的一亩三分地,帮助企业主进行媒体购买投放。而现在,它们不光要帮客户购买投放媒体,还要考量媒体投放给品牌实际带来的销售成效。由单纯
一般建筑材料质量监督检验机构承担水硬性胶凝材料、气硬性胶凝材料、水泥制品、墙体材料、防水材料等建材产品的质量监督检验工作,涉及了大量的检验标准与项目,传统的管理方法