基于密度维度树的增量式网格聚类算法

来源 :武汉科技大学 | 被引量 : 2次 | 上传用户:Waaa
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于数据流的快速性、海量性且持续到达的独有特性,使得以往针对传统静态数据的聚类算法失效,如何利用有限的存储空间对实时数据流进行快速分析,进而准确有效地从数据流中挖掘出有价值的知识和信息,是目前数据挖掘领域中的一个难题。因此,研究设计出适应数据流特性的聚类算法,是十分重要的,也是很有现实意义的。本文在分析研究了传统聚类算法和数据流聚类算法的优缺点后,在PDStream算法的基础上进行改进,提出了一种新的基于密度维度树的增量式网格聚类算法IGDDT。该算法引入一种模式快照策略,来确定下一次聚类的时刻以及保存模式快照的时刻,并可以充分利用前一次聚类的结果更新现有聚类簇,这种增量式的聚类方法可以有效提高聚类效率。同时,在聚类过程中采用新的网格划分策略对网格单元再次进行均匀划分,以达到精确描述聚类边缘,提高聚类的质量的目的。在真实数据集与仿真数据集上的实验结果表明,IGDDT算法不仅可以发现任意形状的聚类,而且聚类准确度以及聚类效率均要高于传统的网格聚类算法。
其他文献
九十年代中期以来,Internet的飞速发展对电信业产生了巨大而深远的影响,基于分组交换网络的多媒体通信系统逐渐成为人们关注的焦点。音频和视频压缩技术、实时数据传输技术及
学位
以太网技术已经不仅仅广泛应用于局域网,而且在不断向城域网领域渗透。万兆以太网技术的成熟使得以太网技术在城域网中应用成为可能,而目前万兆以太网技术的可靠性、服务质量(Q
Cell处理器是一种高性能单片多处理器,它的出现使得处理器性能产生了革命性的进步,针对它的应用研究也越来越广泛,将会在更多的领域得到推广应用。基于像素的多分辨率纹理合
许多工程领域中的调度和规划问题都相当地困难,尤其是大规模调度和规划优化问题。飞机地面作业调度(AGSS)就是这样的一个问题。本文在回顾了飞机地面作业调度相关领域的研究
随着移动通信的高速发展和Internet用户数目的急剧增加,越来越多的人希望在移动过程中使用移动终端通过无线方式接入Internet,以获取所需的信息,并且能够在移动的时候获得与静态
XML,(eXtensible Markup Language)已成为数据交换事实上的标准,随着Web的发展,越来越多的XML数据以流的形式存在,如何在XML,流上高效地执行查询成为当今研究的热点。XML查询的语
目前,大多数垃圾邮件过滤器独立工作,所能获得的垃圾邮件信息较少,效率较低。不仅如此,垃圾邮件制造者不断地利用新技术和新方法,使垃圾邮件的内容和发送手段等都发生了明显
由于广泛的应用前景,无线自组网已经成为通信,网络,系统等研究领域的一个热点。在无线自组网中,组通信模式的应用更为常见,比如:战地通信,视频会议,路由搜索,数据采集等,而多播被公认为
随着FPGA技术的快速发展,所支持的高级硬件平台呈现高速、并行性、原型数字系统快速开发和可优化等特点;另一方面,在信息时代,数字图像压缩技术得到了广泛应用,其中,JPEG图像压缩算
分子系统发育分析是生物信息学中的重要研究领域,它的主要研究手段是从一组同源的DNA或蛋白质序列出发,计算各个序列之间的进化距离,从而得到反映物种进化关系的进化树。进化