改进的FCM算法及其应用研究

来源 :山东科技大学 | 被引量 : 0次 | 上传用户:zhenming1215
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘技术将有价值的信息和知识从海量的数据中挖掘出来,而聚类分析作为数据挖掘的一个重要分支,被广泛应用于生物医学、金融、互联网、图像处理等领域。其中,基于划分的聚类算法具有思想简单、时间复杂度低,更适于快速处理海量数据的特点,因此更具研究意义和实践价值。模糊C均值(FCM)聚类算法作为一种常用的基于划分的聚类方法,存在K值不确定、对初始簇中心点敏感等问题。针对以上问题,本文提出了改进算法,并将该算法应用于烟支的质量检测。论文的主要工作如下:(1)将Canopy算法和密度峰值聚类算法思想运用到FCM算法中,提出了改进FCM算法初始簇中心的方法。针对传统FCM算法的聚类数目不确定且聚类结果对初始簇中心的选择过度敏感的不足,本文提出了结合Canopy算法及密度峰值算法优化的FCM算法。首先使用Canopy算法对样本数据集进行一遍聚类,得出簇中心点的个数。进而结合密度峰值算法的思想,构造簇中心选择指数,确定较为精确的初始聚类中心点。在UCI数据集上的实验结果表明,本文提出的算法较传统的模糊C均值聚类算法,能更快的找到最优的簇中心点,并加快了算法的收敛速度,具有更好的性能。(2)将本文提出的聚类算法应用在烟草行业中,在烟支数据集上进行了两组实验。首先使用本文提出的聚类算法对烟支进行品牌划分及预测,使不同品牌的烟支划分到不同的簇中,相同品牌的烟支聚到同一个簇中。其次,通过分析烟支的单重、长度、圆周、吸阻等物理指标,用本文提出的聚类算法寻找离群点,进而找到烟支数据的不合格产品,并计算各品牌烟支的合格率。两组实验证明,本文提出的聚类算法,在烟支的划分预测任务下可获得更好的效果,可辅助卷烟厂对烟支进行质量检测。
其他文献
通过电热毯产品转正前后的细则对比可以看出电热毯产品转证前后的不同实施原则和要求,电热毯生产企业可依据相关认证时间安排、证书转换要求、以及相关材料做好证书转换的准备
在铁路发展的过程中,通信技术也在不断地发展,轨道电路为信号系统的主要设备,具有重要的作用。轨道电路属于信号轨旁设备,综合检测列车每天都进行日常检查,积累了大量的检测
《木兰诗》是北朝乐府民歌中的精华,历来为人们所称颂,其中木兰的形象打动了无数的读者,并成为女英雄的代名词。这位女英雄隐藏自己的身份长达数年,更让人觉得实属不易,诗曰
新课程倡导自主、合作、探究的学习方式,学生的学习由被动的接受式转变为主动的探究式,因此要求教师的教学方法也要灵活多变。表演式教学法就是在这样的背景下,引起了大家的
针对老年口干症的临床表现,采用中医辩证法进行施治,取得较好的疗效。
发表声明并非在任何时候都是一剂良方。沉默策略可应用于以下情况。首先,企业没有重大的产品质量等实质性问题,而是在其他方面出现问题使品牌受到威胁,且企业决策者的解释可能对
突发事件的处理是国际汉语教学中课堂组织与管理的重要内容。根据事件的成因,国际汉语教学中的突发事件一般可分为三种类型:由外因引起的突发事件,由教师引起的突发事件,由学生引
工程项目管理是提高企业市场竞争力,实施成本管理的一个有效手段,提高企业的工程管理水平,对企业的发展有着非常重要的作用。本文对当前我国建筑工程施工管理的现状进行了分析。
介绍了中国颜色体系国家标准,以及中国颜色体系国家标准在建筑涂料色彩应用中的设计方法、未来建筑涂料色彩的发展趋势等。
怎样让书法课堂更贴近儿童,让儿童在愉悦中学习书法,在书写中得到书法文化的滋养。本文结合具体的课堂案例从儿童角度出发,谈书法课堂的教育教学应当童味、清简、辽阔。