【摘 要】
:
面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人
论文部分内容阅读
面向流数据的传统聚类算法主要有3个方面的不足,一是对流数据不断进入的动态环境不太适应;二是其微簇半径不能随流数据分布的密度变化进行相应的伸缩;三是其聚类阈值严重依赖人为摸索.针对这些不足和流数据环境普遍采用的两层聚类框架,提出了基于微簇优化的三层流数据聚类框架,并在此基础上提出了基于最优2k近邻的流数据聚类算法.该算法的在线层不断地凝聚微簇的密集状态,优化微簇并自适应地调整微簇半径,而离线聚类层还利用先验聚类结果调整聚类参数.实验结果表明,所提出的算法提高了流数据聚类的稳定性、精确性和可扩展性,具有良好的聚类效果.
其他文献
空调净化系统是屏障设施的主要组成部分之一,它的功能是将屏障设施的温度、湿度、风量、换气次数和空气的洁净度等内环境指标控制在"国标"规定的范围内,为实验动物提供良好的
叉头盒转录基因M1(forkhead box M1,FoxM1)是细胞增殖特异性转录因子,分为A、B、C三类,促进细胞周期进入S期和M期,并调节基因的转录、染色体的分离以及胞质的分裂,FoxMl的表
类风湿关节炎(RA)是一种以关节滑膜炎为特征,以慢性多发性关节炎为主要临床表现的一种全身免疫性疾病.现对RA免疫学的抗原抗体检测作一综述.
神经病学是研究神经系统疾病的临床医学学科.由于青年教师教学经验少,讲授神经病学课程有一定困难.本文就神经病学课前准备、课堂教学方法、多媒体应用及课后总结等方面存在
流形学习算法分为两类,一类是等距映射算法,一类是等角映射算法,它们都有各自适用的数据类型.现有的流形学习算法都是直接处理流形数据,不对数据集作数据类型判定,使得算法在
Web服务的自包含、自描述和模块化的特性使之迅速受到工业界和学术界的极大关注,其中,服务组合是研究的热点和难点.然而Web服务的海量性、服务描述的异构性以及服务的动态变
在深入分析各种空间连接算法特点的基础上,提出一种可以有效提高多路空间连接效率的优化方法.该方法一方面针对空间数据的聚类特性,提出了获得更加紧凑的R树索引结构的算法;另
随着网络速率的不断提升,网络安全系统对于数据包内容的实时检测变得越发困难,基于零拷贝思想和多核技术设计实现了一种高速报文内容检测系统,系统采用零拷贝的思想消除数据
抗磷脂综合征是一种累及多器官的系统性自身免疫性疾病,临床以反复发作的动静脉血栓形成、自发性流产、血小板减少以及持续的血清抗磷脂抗体阳性为主要特征.神经系统的受累是
传统的协同过滤推荐算法大部分只考虑单一的用户相似度,而忽略了用户其他特征,随着Web2.0和社交网络等互联网新概念模式的发展,用户对个性化推荐技术的要求越来越高.针对上述