基于差分进化的模糊C-均值聚类算法研究

来源 :电子科技大学 | 被引量 : 4次 | 上传用户:chenjun7575
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数据库和信息技术的快速发展,人们面对的数据量以爆炸式的速度增长,为了更好的利用资源,从这些数据中获取有价值的信息,数据挖掘技术应运而生。目前,在数据挖掘领域的研究中,聚类分析是很重要的一支,许多有效的聚类分析算法被提了出来。其中,模糊C-均值(FCM)的理论基础相对完善,是应用的比较广泛的一种聚类算法。但是该算法过分依赖于初值,而且对噪音数据比较敏感。差分进化(DE)算法是一种模拟生物进化的随机搜索算法,其优势在于过程简单、控制参数少、易于实现,而且具有较强的全局收敛能力和鲁棒性。基于差分进化的模糊C-均值聚类(FCDE)算法就是将DE算法应用到FCM算法中,在一定程度上解决了FCM算法过分依赖于初值,对噪音数据敏感的问题。但是由于FCDE算法的变异和交叉操作的随机性,使得其收敛速度特别慢。因此,本文针对FCDE算法中存在的以上问题,对其进行了深入的研究。主要工作如下:1.针对DE算法交叉操作粒度过大的问题,本文引入了新的交叉算子,使得交叉对象由原来的样本数据改为样本数据中的维度,提高了解的精度;针对DE算法对变异缩放因子F和交叉概率因子CR敏感的问题,本文引入了自适应更新操作,使F和CR在整个算法的执行过程中,实时动态更新,而不是原来的常数,降低了DE算法对F和CR的敏感性。2.针对DE算法收敛过慢的问题,本文引入了新的变异算子,采用一种贪心策略,使DE算法更快向最优解收敛;为了防止其陷入局部最优,引入了突变机制,使DE算法最终能收敛至全局最优。最后本文将改进后的DE算法应用到聚类问题中,提出了一种改进的基于差分进化的模糊C-均值聚类算法-1(IFCDE-1)。3.同样,针对DE算法收敛过慢的问题,本文从另一个角度将FCDE算法和FCM算法结合起来,充分利用FCDE算法不依赖初值和FCM算法收敛速度快的优点,提出了另一种改进的基于差分进化的模糊C-均值聚类算法-2(IFCDE-2)。4.为了验证算法的有效性,本文采用了3组开源的真实数据集和2组自定义的数据集进行实验,实验结果表明本文提出的算法能够在保证精度的前提下提高收敛效率。
其他文献
在政府的信息化建设过程中,随着业务规模的不断扩大和计算机技术的不断发展,在许多单位或部门都逐步实现了业务、信息的计算机化管理。然而由于不同时期构建的业务系统可能基
英语口语发音评测是计算机辅助口语学习所面临的一个重要课题。尽管当前的口语发音评估系统可以提供一些令人振奋的评估结果,但他们大多是关注发音的声学特征的评测,很少关注
优化功能在编译器设计中是至关重要的,编译器优化分为基于中间代码的与机器无关的优化和基于目标代码的与机器相关的优化。本论文针对一款16位嵌入式CPU系统C编译器的设计,分
NVD(Next Versatile Disc)是基于红光技术的新一代高清光盘播放机,它不但实现了与国外蓝光播放机相同的高清播放性能,还以其相对低廉的价格,对蓝光形成市场竞争优势。但是,片
近年来,随着企业信息管理的复杂化,工作流管理已经成为当今发展最为迅速的计算机应用技术之一。而Petri网由于具有严格的数学规范以及形式化的定义,对于工作流的建模以及分析
在下一代计算机网络的领域中,由于种种原因形成了网络的异构性,对异构网络的互连,互通,互操作的研究已经成为关注的热点。MPLS(Multi-Protocol Label Switching),即多协议标
职业技术院校校园网与其他网络一样不仅受到来自外网的攻击,而且更严重的是它还会受到来自内网的攻击,其受攻击可能性比一般的网络还要大得多。其原因是校园网中大部分是正在学
教育评估是教育信息化的重要研究领域,它可以发现人才培养过程中成功和不足之处,对保障和提高教育质量具有重要作用。教育部学位与研究生教育发展中心的学位评估网络信息系统
入侵检测作为一种积极主动的安全防护技术,提供了对内部攻击、外部攻击和误操作的实时保护,在网络系统遭受危害之前拦截和响应入侵。从网络安全立体纵深、多层次防御的角度出
相对于其它生物识别技术,虹膜识别具有以下优点:虹膜具有丰富而独特的纹理特征,每个虹膜都是独一无二的,非常适用于身份鉴别;虹膜特征稳定、难于伪造,更为可靠;另外采集虹膜图像