云计算环境下高复杂度动态数据的增量密度快速聚类算法研究

来源 :计算机科学 | 被引量 : 0次 | 上传用户:hackls
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对传统的聚类算法存在开销大、聚类质量差、聚类速度慢等问题,提出一种新的云计算环境下高复杂度动态数据的增量密度快速聚类算法。首先,依据密度对云计算环境下高复杂度动态数据进行聚类,从数据空间中找到部分子空间,使得数据映射至该空间后可产生高密度点集区域,将连通区域的集合看作聚类结果;其次,通过DBSCAN算法进行增量聚类,并对插入或删除数据导致的原聚类合并或分裂进行研究;最后,在更新的过程中通过改变核心状态数据的邻域中含有的全部核心数据进行处理,从插入或删除数据两方面进行增量聚类分析。实验结果表明,所提算法开
其他文献
针对目标移除修复方法中存在的修复顺序不合理以及错误匹配问题,提出一种基于结构稀疏度和块差异度的图像修复方法。首先,在优先权中增加块的结构稀疏度计算,使优先权不仅依赖于目标块的几何特征,而且可以反映其邻域特征,提高了对目标块所处区域特征的辨识度,从而使修复顺序更加合理。其次,定义目标块与样本块之间的差异度,并在此基础上定义新的匹配规则,不仅对已存在像素之间的相似程度进行衡量,而且对已存在像素与填充像
多标签特征选择是应对数据维度灾难现象的主要方法之一,可以在降低特征维度的同时提高学习效率,优化分类性能。针对目前特征选择算法没有考虑标签间的相互关系,以及信息量的
组合测试是系统测试中一种非常有效的方法,能够在保证错误检出率的前提下采用较少的测试用例来测试系统。但是,组合测试用例集构造问题的复杂度是NP完全的。给出了一种基于符
字符识别是车牌识别的一个关键环节。在对车牌字符集进行深入分析的基础上,提出了形状特征向量等概念,从理论上分析并证明了形状特征向量用于车牌字符识别的可行性。文中提出了一种基于形状特征向量的车牌字符识别算法,并进行了仿真实验。实验结果表明,形状特征向量能够用作车牌字符识别,基于形状特征向量的车牌识别算法具有97.31%的正确率;此外,该算法没有复杂的训练过程,不需要大量数据来记录训练结果,实现简单,是
非实验室场景下的人脸图片数量巨大,更加贴近生活,对其进行识别具有较大的研究价值。文中对非实验室环境下的人脸属性识别问题进行了研究,提出了一种人脸属性识别网络(Regional Multiple Layer Attributes Related Net,RMLARNet),不仅对人脸特征的提取方式进行了研究,还挖掘了人脸属性间的关系。该网络由3个部分组成:1)将人脸图像分割成包含属性部位的多个局部区
三支决策模型和证据理论在概念、信息处理方式上存在着互通互补之处。首先,将证据理论基本概念引入到三支决策中,分析其延迟信任区间可能包含的可变语义,分别构建了基于证据
在流场可视化领域,优化算法进行以及提升可视化效果一直是研究者关注的重点。近年来,也有很多评估可视化质量的研究和改进算法被提出,但是,在算法实现和质量评估的过程中往往面临流场方向的二义性以及矢量场方向和大小描述不清的问题。为了解决该问题,尝试将人类视觉感知理论应用于对流场可视化结果质量的评估以及可视化效果的提升上,并在此研究基础上利用模拟旋风数据对二维线积分卷积矢量场可视化算法进行了研究和实现。
为实现对腭裂高鼻音等级的自动识别,通过对语音信号小波处理和特征提取方法的综合研究,提出基于小波分解系数倒谱特征的腭裂高鼻音等级自动识别算法。目前,研究人员对腭裂语
为了解决大数据时代下小样本数据预测精度不高的问题,提出一种基于堆栈降噪自编码(SDA)与支持向量回归机(SVR)的混合模型。该方法采用源域大样本数据对堆栈降噪自编码和支持
如何平衡嵌入式设备的能耗和性能表现,成为了一个热门话题。动态能耗管理是一种在保证系统性能的基础上降低其能耗的有效方法,其关键点是如何生成有效的动态能耗管理策略。在