基于改进的CLIQUE算法的高维数据流聚类研究

来源 :辽宁工程技术大学 | 被引量 : 0次 | 上传用户:douzixia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文在传统的CLIQUE算法上提出了一种改进的CLIQUE算法。该算法采用新的网格划分方法,通过将网格单元边长再细分为两份,避免了CLIQUE算法在生成候选密度单元时可能会丢失潜在的数据点的问题;提出一种处理与稠密单元相邻的稀疏单元内的数据点的方法,能有效提高聚类的精度;使用一种新方法处理同一个簇中的稠密单元不相邻的问题,改善簇的数目不准确的问题;设计了一种自顶向下的簇生成过程来提高算法的效率,避免了CLIQUE算法在高维空间中计算量过大的问题,并且避免MDL剪枝造成的精度丢失。在改进的CLIQUE算法的基础上提出了高维数据流聚类算法HA-Stream。该算法将聚类过程分为在线和离线两个阶段,离线阶段使用改进的CLIQUE算法有效提高算法的效率和聚类的精度。   通过实验结果表明,与CLIQUE算法和CluStream算法相比,HA-Stream算法具有更高的聚类精度和更好的可伸缩性,证明了HA-Stream算法是有效可行的。
其他文献
宾馆服务业与国际市场接轨己成为大势所趋,面对激烈的市场竞争和纷繁复杂的业务需求,就必须提高整体竞争能力,变革宾馆的管理模式,提高管理水平。目前国内宾馆的信息化管理的
随着计算机硬件技术的不断发展、用户对传统PC使用方式的不断改进,桌面虚拟化技术逐渐被人们所认知。用户访问自己的虚拟PC,可以如同操作传统PC一样简单方便,轻松的使用各种
视觉注意机制是以认知学、神经心理学等相关研究领域的成果为基础,运用数学方法建立感知模型,力图实现对生物视觉系统的模拟。本文的主要工作是针对视频序列中跟踪算法会受背景
人名具有很强的歧义,现实生活中同一个姓名可能被多个实体人物所使用。尤其在信息量快速增长的互联网中,人名歧义性问题已经成为一个迫切需要解决的问题。人名消歧研究的是将相
本文的研究围绕物联网编码寻址展开,在对物联网资源编码寻址特性研究的基础上,定义物联网轻量级编码模型,将此模型作为理论基础并结合物联网感知节点的特殊性,研究一种基于轻
模糊推理是一种不确定性的推理方法,它是模糊专家系统、模糊控制系统等领域的重要理论基础.讨论基于模糊推理算法构成的模糊系统的响应能力是模糊控制理论的一个重要的研究方
随着网络上电子信息的剧增,如何准确高效的获取需要的信息变得日益重要。文摘作为文档内容的概述,它的简洁性、概括性、可读性和客观性能够满足人们高效挖掘有用信息的需求。因
随着Web服务应用的日益广泛,作为制约其进一步发展的安全问题越来越突出,Web服务通信安全的主要目标包括机密性、完整性、不可否认性、认证与授权等,传统的安全解决方案难以
近些年,计算机网络通信在有线通信和无线通信系统中,扮演着越来越重要的角色。因为其主要的目的是传送从模拟信号转变成的数字信号,所以其中必然有转变产生,一些损害因素,如噪声,干
随着网络和信息技术的不断发展和快速普及,传统的社会网络关系已经延伸到虚拟网络环境中,形成了基于网络的互动服务,即社会网络服务(Social Networking Service, SNS),为用户