一种新的全局收敛的混合聚类算法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:zhezhe_1207
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类算法是指将具有多个属性的数据集分组成多个类的一种方法,在相同的类中,数据的相似性较大,而在不同的类中,其差异性较大,所以通常在应用时,可以将同一个类中的数据看作统一的整体。在大数据时代的今天,每天都在产生着海量的数据,对这些数据的适当处理和合理应用变得尤为重要。聚类分析是数据挖掘的重要手段之一,被广泛应用于各个领域。例如在商务上,聚类能帮助发现购买模式相近的顾客从而挖掘消费群体特征;聚类还广泛应用在基因和蛋白质的分类上,能发现表达相似的基因或蛋白质,这样便于研究它们的内在结构,给生物医疗、植物学、动物学等带来了很大的进展;在金融领域,利用聚类分析发现离群点,可以识别欺诈和金融犯罪行为。如今,聚类分析已是一个十分重要的研讨课题,不少学者在这方面做出了意义非凡的成果。聚类不同于分类,是没有训练过程的,事先并不清楚要分成几个组和什么样的组,其类别在聚类过程中生成。其中比较常用的有系统聚类法和基于蚂蚁成堆的蚁群聚类算法。但是在实际操作中,往往可以通过一些先验知识或者假定事先确定类别数,这样便于算法实现。最为经典的聚类算法莫过于K-Means方法,它的收敛速度极快并且非常易于实现,但是其最大的弱点是容易陷入局部最优和对初始聚类中心敏感。XK-Means方法对K-Means做了改进,对聚类中心加了随机探测向量进行扰动,这样可以适当地减轻其容易陷入局部最优的缺点,但是,扰动操作可能在聚类过程中产生空类继而导致运算过程中断。为此,本文针对这些缺点,提出一种填补空类的IXK-Means方法,结合了K-Means和XK-Means的优势,算法又可操作,然而这样的改进还是不够,IXK-Means仍然有陷入局部最优的可能。考虑到遗传机制可以达到全局最优,本文提出将遗传算法与IXK-Means方法混合,即用IXK-Means操作代替遗传算法中的交叉操作,从而得到一种新的遗传IXK-Means算法,简称GIXK算法。该算法收敛到全局最优解,并且与另一种全局最优的遗传K均值算法相比,其收敛速度更快。然而,该算法需要事先确定类别数,若对于一个没有先验知识的数据集,往往因为不确定其类别数而难以恰当操作。在此基础上,本文提出一种设想,将蚁群聚类算法混合到GIXK算法中,即先利用蚁群聚类确定大致类别数,再用GIXK算法快速聚类,这样不仅能收敛到全局最优,而且对于任何数据集都可操作。本文通过数值实验和理论证明验证了GIXK算法相比其他几种算法能得到更好的聚类结果并且收敛到全局最优解。
其他文献
随着国家的不断壮大,我国对国民素质教育的要求也不断提高,课程改革也更是推陈出新.新课改的实施给小学语文教学带来了前所未有的挑战,同时也走入了另一番新的天地.本文对小
品牌不是广告宣传而形成的,品牌的内涵包括很多内容,如产品质量、性能、价格、服务、供货及时性和多样性等许多因素。一个品牌如果离开产品内涵的支持,而只是一味地强调广告
注意力是智力的重要组织部分.低年级的学生注意力容易分散,不能长时间集中注意力听课.如何培养低年级学生数学课堂的注意力是一个值得我们探讨的问题,本文试从前期目标、中期
科学合理地创设教学情境是提高数学课堂教学效率的重要手段。本文从新课程理念出发,重新审视教学情境的概念内涵,阐明了创设教学情境的重要意义,对如何创设有价值的教学情境进行
幼儿音乐教育对培养幼儿养成正确的音乐素养,开拓思维具有推动性作用,因幼儿的年龄较小,在整合音乐教育资源中需要加强对音乐游戏的应用,多方面实现融合,如此才能真正推动幼
在计算几何中曲线曲面拟合一直是众多学者研究的一个重要问题,目前已经形成一些成熟的理论体系与方法,有B样条曲线曲面方法、NURBS方法等。然而自然界或工程技术中的大量实际
这篇论文讨论了如下的一个新的广义变分包含组问题:   通过应用伴随A单调映射的预解算子技术和Banach压缩映射原理证明方程组(a),(b)有解,进而证明(a),(b)有唯一的解,再通过它
本课题的研究以物联网为基础,通过物联网建立人与蔬菜的联系,让蔬菜的生产、加工、储运、销售等各个环节透明化,菜农与监管部门更为严苛的对蔬菜质量安全进行干预、监管和调
根据智能控制系统这门课程的教学内容和课程特点,结合作者自己的教学实践经验,提出了在智能控制系统课程的教学过程的一些思考。 According to the teaching content and cu
许多动力学现象受一个或多个变量的过去历史的影响,而具有记忆项的偏微分方程就研究此类问题。本文研究了具有非线性记忆项的非线性弱阻尼波动方程因为该方程具有弱阻尼项和记