基于蚁群算法的混合聚类算法研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:et789
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在聚类分析问题中,实际应用的复杂性以及数据的多样性往往使得某个算法仅适用于某一类特定数据,且存在一定缺陷。因此,许多新的聚类算法不断被提出。基于蚂蚁化学识别系统的聚类算法(AntClust)是一种新型的生物模拟进化算法,它能自动形成聚类数目、能发现任意形状的簇、能处理任意类型的数据,有较强鲁棒性和适应性。然而,AntClust算法是基于随机选择的,且使用较多统计的随机性参数作为判定依据,导致算法计算误差较大。同时,它删除小巢的方法也过于呆板,不够灵活。本文从对AntClust算法进行改进和将改进的AntClust与K-means算法进行组合两方面着手,构建一种新的混合聚类算法,来提高聚类结果的质量。针对蚂蚁初始化、行为规则、相似度计算和小巢删除等方面存在的问题,提出了新的随机碰面规则、相似度计算方法、复杂聚类中心定义和小巢删除规则等改进措施。改进过程中,将“均值”的思想用于行为规则中,降低了随机性带来的误差,提高了运算的精确度;新的复杂聚类中心,使算法能够计算类别属性的“平均值”,提高了算法的处理能力,为与K-means算法的组合奠定基础。改进的AntClust算法降低了迭代次数,提高了聚类结果的质量。结合改进的AntClust特点,对K-means算法进行适当的修改:通过设定最大迭代次数控制K-means算法的停止;迭代过程中能更新蚂蚁的接受阈值。按照以改进型AntClust算法为总体框架,将K-means算法融入其中的思路组合这两个算法,通过二者反复调用来处理数据。混合算法在提高计算精度方面比原AntClust算法有更优秀的表现。在UCI数据集上的实验结果表明了对AntClust的改进和与K-means算法的组合是有效的,在获得有效聚类的同时,提高了聚类结果的质量。
其他文献
细胞神经网络(Cellular Neural Network)模型可实现混沌系统复杂的动力学行为,作为继电阻、电容、电感三大电路基本元件外的第四类电路元件忆阻器,其非线性和记忆特性可模拟
目前,基于B/S模式的MIS系统广泛应用于人们的生产和生活中,发挥着越来越重要的作用,然而由于设计及其防御技术等种种因为,该系统中存在着诸多不安全因素,成为网络安全攻击的
学位
随着社会经济的快速发展,智能交通监控系统将成为道路交通管理的有效手段。交通场景下的运动目标跟踪技术是智能交通监控领域的关键问题之一。主要包括:运动目标的检测、目标
近年来,数据挖掘研究发展十分迅速,教育管理系统的信息化建设也得到了较好发展,各类教育管理系统积累了丰富的数据。但数据挖掘在教育管理系统中的应用尚处于探索阶段。因此,
近几年来伴随网络技术的发展,P2P技术已经得到了广泛的应用,据调查,P2P应用产生的网络流量己占据ISP业务总量的60%-90%,严重影响了正常的网络业务,甚至引起网络拥塞。而且对
现场总线控制系统(FCS)是继集散控制系统(DCS)之后的新一代控制系统,成为当前控制领域内的热点之一。现场总线技术是现场总线控制系统的核心,其中的PROFIBUS现场总线又是目前最
以计算机技术和网络通信技术为主要标志的信息技术在学校的推广,使学校的运作方式、管理方式发生了很大的变化。在学校推进电子信息化管理的过程中,各部门往往不能一次性引入
随着互联网的应用和普及,以及个人计算机硬件的不断发展,信息的流通得到了飞速的发展,特别是电子书的出现,更加速了信息传播的速度。现在一般的个人电脑的存储容量动辄500G,
传统的信息处理过程中,Nyquist采样定理要求采样速率至少是信号带宽两倍。随着信息数据量的增大,这一条件对传统信号获取过程带来了极大的压力。2004年,D.Donoho、E.Candes等
空间数据库是目前地理信息系统(GIS)应用的一个很重要的部分,空间数据库的设计与实现直接关系到整个GIS系统的功能和效率。而数据是空间数据库的重要组成部分,空间数据库中的数据