一种基于收缩估计的增强K-means算法

来源 :兰州大学 | 被引量 : 0次 | 上传用户:q2347386
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类是研究数据相似性的一种方法,它被广泛应用于统计学、气象学、医学等诸多科学领域.本文从提升预测能力的角度出发研究了聚类算法,并提出了增强收缩K-means算法,它是基于James-Stein收缩估计和学习向量量化(LVQ)方法的一种新的聚类方法.这种新算法主要考虑了无监督聚类和监督分类的优点,在每次迭代中,首先使用K-means算法为每个数据点获取一个临时标签,对于这些有标签数据,利用LVQ算法来获取原型向量,然后将前一阶段获得的聚类中心通过James-Stein估计量向原型向量收缩,最后再将这些收缩后的中心用于新一轮的K-means迭代聚类.算法不断执行“K-means-to-LVQ-Shrinkage”的迭代过程直到达到停止条件为止.此外本文还进行了大量的模拟数据和实际数据分析,以评估这种新方法的性能,并获得了很好的结果.
其他文献
阿城八家子-平山区位于小兴安岭-松嫩地块的滨东隆起带,该区域火山作用活跃,岩浆作用强烈,火山岩分布比较广泛,构造演化复杂。但是,目前对于火山岩岩石学和火山构造的研究还
随着全球气候的变化及生态环境的日趋恶化,生物多样性保护越来越受到世界各国的重视,保护的重点在于特有及濒危类群。而特有种由于分布区域狭窄、野外种群较小而极易变成濒危
商业计划的主要目的是评估在哥伦比亚创建一家提供惊喜旅行套餐的旅游公司的可行性。目前,来哥伦比亚的国内和国际旅行者不断增加,旅游业的创新却不足,互联网的发展提供接入,
太阳射电辐射携带大量信息,在频谱上有着丰富的表现形态,其中,射电爆发的精细结构与物理起源有关,能够用以诊断激波过程和粒子加速等机制。观测与研究太阳射电爆发过程具有重要的科学价值,也具有独特的空间物理--空间天气学研究方面的应用价值。项目组研制了高分辨率的射电频谱仪,可对太阳射电爆发过程进行快速且高效的分析。但在米波段,空间中存在大量的射频干扰信号,主要是各种电台信号干扰,严重干扰了太阳射电信号的接
目的:研究自发性脑脊液鼻漏术前的瘘口影像学定位诊断方法,探讨经鼻神经内镜下脑脊液漏修补的手术方法、瘘口修补技术和修补材料的选择。方法:选取青岛大学附属医院2014年1月
心理应激是指当个体面临社会心理挑战或威胁时,会产生一系列生理、心理和行为上的适应性反应,以应对内、外部挑战并维持机体内稳态的过程。然而,研究发现,个体的应激反应会受
昆虫缺乏适应性免疫系统,完全依靠先天免疫来抵抗病原物的入侵。当病原物入侵昆虫时,昆虫通过模式识别受体(Pattern recognition receptors,PRRs)识别并结合病原物表面高度保
胰岛素样生长因子-1(Insulin-Like Growth Factor-1,IGF-1),是由70个氨基酸残基构成的单链多肽,作为一种主要由肝脏细胞合成和分泌的重要生长刺激因子,在人体多种细胞中广泛
金属-有机骨架(MOFs)是一类由金属中心离子与有机配体配位自组装而成的新型材料,在对金属有机框架的研究进程中,MOFs的稳定性一直都是困扰科学家们的问题。本文基于对MOFs的
随着科技的日新月异,信息技术的快速发展,图书为人类获取知识提供了便利的途径。图书中含有大量权威的、有价值的信息。在工程科技领域,图书成为人们获取知识,提升专业能力的