三角不等式原理对聚类算法的改进

被引量 : 0次 | 上传用户:gem364258013
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是数据挖掘中的一个重要研究领域,面对大规模的、高维的数据,如何建立有效的聚类算法是一个研究热点。聚类将数据对象分组成若干个类或簇,使得在同一个簇中的对象尽可能相似,而不同簇中的对象尽可能相异,是一种无监督的分类方法。对聚类算法的进一步优化研究不仅有助于算法理论的完善,更有助于算法的推广和应用。 顺序聚类算法不需要提前确定聚类个数,并且是一种非常直接和快速的算法。但是当处理海量数据时,时间效率仍然有待提高。针对此问题,本文在两个阈值的顺序聚类算法TTSAS的基础上,提出一种新的顺序算法TI_TTSAS。该算法应用三角不等式原理,避免了TTSAS算法中冗余的距离计算。实验结果证明TI_TTSAS算法相对于TTSAS算法,在效率上有很大程度的提高,尤其对于高维的大规模数据集,效果更是显著,随着聚类个数的增加,TI_TTSAS算法更有优越性。并且聚类效果保持了TTSAS算法的准确性。 三角不等式原理不仅可以改进顺序算法,只要基于欧式距离度量不相似性的聚类算法,都可以通过三角不等式原理避免冗余的距离计算。k-means是一种基于划分的聚类算法,本文同样利用三角不等式原理节省了运行时间。实验结果证明,该原理对k-means算法的改进效果更是显著。
其他文献
目的:探讨无痴呆的血管性认知功能障碍(VCIND)和血管性痴呆(VaD)的事件相关电位-P300(event-related potential P300,ERP-P300)的电生理特点及其对血管性认知功能障碍(VCI)的
本文从合理避税的概念及特征出发,从经济发展水平、税负轻重水平、税率高低水平、税法的详细条文以及课税对象的叠叉性五个方面阐述了企业合理避税产生的条件。最后,重点阐述
【正】 在经济建设的实践中,发挥中心城市的作用同经济区的规划和建设是密不可分的。因此,研究中心城市问题也应同研究经济区问题联系在一起。以上海为中心的长江三角洲经济
为了培养应用型的经管专业人才,实践教学成为了经管类专业学生培养过程中不可或缺的组成部分。同时,随着计算机和网络技术的发展,各类实训平台也应运而生。然而,由于实训模式
在知识爆炸的今天,研究型大学的科研活动不仅为我国培养了高层次的人才,也为大学在创新时代的发展中提供了动力。我国地方研究型大学建设起步晚,科研绩效评价体系混乱且不完
央行独立性问题是西方经济学争论不已的论题。在90年代,这一理论成为政治经济周期理论的研究核 心,在理论上取得了新的突破。央行独立性问题研究对指导货币政策的制定具有一定的
衍生金融工具是金融自由化和金融创新的产物,具有规避风险和引发风险的两重性。我国入世后,该市场必将在现有基础上迅速扩张,其隐含风险不可忽视。我国应借鉴其他国家经验,加
当前,我国经济形势和外部环境复杂,国内经济运行存在下行压力,特别是国家加快产业结构调整、严控地方债务、化解过剩产能等,部分行业和企业的潜在风险进一步暴露,致使商业银
目的探讨情境式交往训练在双相情感障碍缓解期患者中的应用效果。方法选取我院精神心理临床康复中心收治的双相情感障碍缓解期患者60例,采用随机数字表法分为对照组和观察组
针对现代信息技术对传感器稳定性、灵敏性及精确度要求日益提高,以及日益复杂电磁环境下传感器面临的电磁兼容性问题,论述传感器电磁兼容性内涵及特点,指出目前开展传感器电