【摘 要】
:
聚类分析,是指用数学的方法研究和处理给定对象的分类,它是多元统计分析的一种,也是非监督模式识别的一个重要分支。它把一个没有类别标记的样本集按某种准则划分成若干个子
论文部分内容阅读
聚类分析,是指用数学的方法研究和处理给定对象的分类,它是多元统计分析的一种,也是非监督模式识别的一个重要分支。它把一个没有类别标记的样本集按某种准则划分成若干个子集,使相似的样本尽可能归为一类,而不相似的样本尽量划分到不同的类中。遗传算法起源于对生物系统所进行的计算机模拟研究。它是现代优化技术的一种,具有全局的,并行高效的优化性能,鲁棒性、通用性强,无需问题特殊信息等优点。其内容涉及数学、物理学、生物学和计算机科学等方面,为解决复杂问题提供了新的思路和手段。本文将遗传算法应用于对聚类目标函数的优化问题。针对椭圆状数据应用自适应遗传算法,避免了用单纯聚类方法容易陷入局部极小值的问题。实验结果表明,这种新算法具有较好的鲁棒性。本文共分四章,主要内容如下:第一章为绪论,阐述了聚类分析研究的基本问题,以及遗传算法在优化聚类目标函数问题时的必然性和合理性。第二章回顾了聚类算法的发展历程,重点介绍和推导了基于目标函数的模糊c-均值算法(FCM),并分析了传统聚类算法各自的优缺点。最后,运用FCM算法处理了与基金相关的数据,验证了该算法的有效性。第三章主要分析了模糊椭圆聚类算法(FCE)的缺点,以及产生这些缺点的原因所在,即FCE在初值确定和基于迭代法的交替寻优策略上过度依赖FCM算法,这必然导致FCE算法在实践中往往得不到令人满意的聚类效果。基于此,我们将FCE算法与遗传算法巧妙地结合起来,提出了一种新算法—模糊自适应椭圆算法(AGA-FCE)。数值试验表明,文中所提出的新算法具有较好的抗噪性,并且在优化过程中避免了传统算法易陷入局部极小值的缺点。从而证明了该方法的有效性。最后一章是结论部分。总结了本研究的贡献,并简要叙述了以后的研究前景。
其他文献
最优化是一门应用广泛、发展迅速的学科。它研究某些数学上定义的问题的最优解,即对于给出的实际问题,诸如石油勘探、大气模拟、航天航空等领域出现的特大规模的问题,从众多的方
本文主要介绍了关于有限维高斯测度的一些性质。第一章主要介绍了一维高斯测度和n维高斯测度,以及它们的傅里叶变换和一些基本性质。第二章主要介绍了高斯测度下的Hermite多项
本文考虑了几类脉冲偏微分方程的解的振动性,论文分为四章.
在第一章,我们对脉冲微分方程的振动性做了一个基本概述,同时对本文所做的研究做了一个基本的介绍.
第二章,我
混沌系统的最终界在混沌系统的定性行为的研究中有着重要的作用,若我们可以找到一个混沌系统的全局吸引集,则可以断定在这个全局吸引集之外不会存在该系统其它的平衡位置、周期
Pitman准则是由著名统计学者Pitman于1937年提出来的一种用于比较参数估计好坏的标准。自从上个世纪80年代以来,该准则引起了理论和应用统计学家的极大关注。本文主要研究线性
本文考虑如下具有退化扩散与非局部聚集的Keller-Segel方程ut-△um+▽·(uB(u))=0,(x,t)∈Rd×R+,其中维数d≥3,B(u)=▽((-△)-β/2u),β∈[2,d],1<m<2-β/d.利用Riesz核Iβ(x)=1/γ(d,β)|x|
中国资产评估协会和中国证监会上市公司监管部于8月10日在京召开了上市公司并购重组企业价值评估协同监管沟通会。中国资产评估协会副会长、秘书长刘萍,中国证监会上市公司监
模糊C均值聚类算法(FCM,Fuzzy C-Means Clustering Algorithm)是非监督模式识别中应用最为广泛的算法之一,该算法是基于最小平方误差,并规定了每个样本对各个隶属度的和必须为1
凉水河子镇中心小学地处吉林省东南部山区,这里群山环抱,山高林密,中草药资源非常丰富.结合本地这一特点,我们学校把认识中草药作为校本课程开发的主要内容.这一课程开发至今
“绿宝石”是从山东枣庄万亩石榴园“大青皮甜”的栽培群体芽变单株选育而来的石榴新品种。2011年11月通过山东省农作物品种审定委员会审定并定名(审定编号:鲁农审2011045号)