基于蚁群算法的数据流聚类算法

来源 :东北大学 | 被引量 : 0次 | 上传用户:pxghq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘是应用数学的一个热门研究领域。近年来,随着计算机技术、通信技术以及网络技术的飞速发展,许多领域中出现了连续到达、持续增长、动态演化的数据,这就是数据流(Data Streams)。数据流聚类是数据挖掘中的重要问题,也是当前研究的热点。由于数据流本身的特点,这对于聚类分析算法提出了更高的要求。本文针对经典的数据流聚类算法进行了深入的研究。主要工作如下:将蚁群算法应用到数据流的聚类算法中,得到了一个基于蚁群算法的数据流聚类(Ant-Based Clustering data stream, Abclustream)算法。该算法采用双层数据流的架构,利用概率而非距离对微聚类进行更新,利用概率的方法来判断孤立点。同时本文增设了一个周期检测机制,能够及时发现无效聚类。其次,由于现实生活中的数据流大多带有混合属性,本文将提出的算法推广到混合属性的数据流聚类分析中。最后,本文对提出的算法进行了实验仿真,与Clustream算法进行了比较,结果表明,本文算法在时空复杂性以及聚类质量等方面优于Clustream算法。且本文算法有利于发现任意形状的簇,同时对高维数据流也得到较好的结果。
其他文献
本文讨论源自弹性波导管模型的一类非线性四阶波动方程Cauchy问题的解的长时间行为.利用渐近紧致性和尾部截断技术本文获得了当N≤3时上述间题对应的无穷维动力系统在相空间X
信息技术的发展推动着生产关系的变革,人们的生产方式也由此发生变化,互联网的出现更是加快了这种变化,并且在科研、政务、商务等诸多应用领域带来了深远的影响。如今,在科研
本文研究了两类带有时滞的整数阶HIV-1型传染病模型的稳定性和一类分数阶HIV-1型传染病模型的稳定性,同时对带有时滞的整数阶HIV-1型传染病模型的Hopf分岔进行了研究.  首先
学位
本文提出了一种新的鲁棒函数观测器设计方法。首先通过求解Sylvester矩阵方程,得到系数矩阵T,L的参数形式。T,L均为自由参数的线性组合的形式,便于进行梯度计算。然后对于矩
带进位反馈移位寄存器(Feedback with carry shift registers)简称FCSR,由它产生的序列简称FCSR序列。2-adic复杂度类似于线性复杂度,所以2-adic复杂度在流密码学应用中有非
城市规划是研究城市的未来发展、城市的合理布局和综合安排城市各项工程建设的综合部署,是一定时期内城市发展的蓝图,城市建设和管理的依据。随着计算机科学的发展,近年来各
邓小平理论与“三个代表”重要思想,既是对马列主义、毛泽东思想的承续,又是创造性的发展,它是和平与发展时代的马克思主义,是当代中国的马克思主义,是全党必须长期坚持的领
有理Bézier曲线是计算机辅助几何设计中常用的一元函数参数形式。由于其具有良好的几何性质和比较成熟的算法,所以备受国内外学者的关注。近年来关于有理Bézier曲线插值与逼
近几十年来,保持问题已经成为国际矩阵论研究中一个十分活跃的领域。这一方面是因为它具有重要的理论价值;另一方面是因为许多问题在量子力学、微分几何、微分方程、数理统计和