约束谱聚类算法研究

来源 :中国矿业大学 | 被引量 : 0次 | 上传用户:zhang11289
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
谱聚类算法是基于谱图划分理论的一种机器学习算法,是在谱图理论的基础上建立而成,其本质是将聚类问题转化为图的最优划分问题。与传统的聚类算法相比,它具有能在任意形状的样本空间上聚类且收敛于全局最优解的优点,而且可以获得在放松了的连续域中的全局最优解。但是传统谱聚类算法的一些缺点也是不容忽视的。首先它很难正确发现密度相差比较大的簇,参数的选取要靠多次试验和个人经验,其次,在传统的谱聚类算法中,不管是参数敏感问题还是聚类数目的难以确定问题,都会导致聚类鲁棒性过差。在聚类过程中,参数的数值和聚类的个数要靠研究人员经过多年实验和多次尝试去决定,不同的参数或不同的聚类个数可能会使得聚类结果有很大的差异。并且在传统的约束聚类算法中,随机查询策略也会带来聚类结果的不稳定性。本文针对上述所存在的这些问题对谱聚类算法进行了研究,具体内容如下:针对谱聚类算法对于密度相差很大的簇聚类效果较差的问题,本文通过加入成对约束概念指导谱聚类过程,建立了一对约束组,即must-link和cannot-link,该约束组被用以描述两个样本之间的关系。约束组中must-link代表两个样本属于同一簇,而cannot-link表示这两个样本属于不同簇。结合这种半监督聚类的思想,本文通过对传统谱聚类算法的改进提出了一种基于共享近邻的成对约束谱聚类算法PCSC-SN(Pairwise Constrained Spectral Clustering Based on Shared Nearest Neighborhood)。PCSC-SN算法是用共享近邻去衡量数据对之间的相似性,用主动约束信息找到两个数据点之间的关系。通过在人工数据集上的实验结果表明,这种算法会获得更好的聚类效果。为了解决谱聚类算法的参数敏感、聚类个数难确定问题以及在约束谱聚类算法中随机查询策略所带来的不稳定问题,本文提出了一种基于Bethe Hessian矩阵的主动约束谱聚类ACSCHM(Active Constrained Spectral Clustering Based on Bethe Hessian Matrix)算法,该算法使用了Bethe Hessian矩阵代替Laplacian矩阵,解决了参数敏感问题,通过Bethe Hessian矩阵负特征值的特征向量的个数来估计聚类个数,有效的解决了聚类数目难以确定问题。本文采用主动查询策略来代替原来的随机查询策略,克服了随机查询带来的聚类结果的不稳定问题,增强了算法的鲁棒性。实验结果表明,采用这种算法可以有效提高聚类准确率。
其他文献
本文采用文献资料法、专家访谈法、调查问卷法和数理统计法等方法,通过对中关村时尚网球俱乐部41名网球初学者参加网球墙练习情况的调查,调查日常教学中网球墙的运用情况及网球
钩端螺旋体脑动脉炎(简称钩脑)是钩端螺旋体感染最常见的脑血管并发症.1994年2月~2001年1月,我们根据其起病形式的不同,运用中药治疗57例,并与西药治疗的51例作为对照,现将结
根据学前教育专业建设现状,对师资队伍、学生能力、课程设置、教学与实训存在的主要问题进行了梳理,并对这些问题进行了原因分析。高校应从教学体系、校内外实训室和实训基地
随着卫星技术的不断发展,星载红外目标检测系统在军事和民用领域中发挥着越来越重要的作用。但是,由于卫星红外图像背景复杂、目标点小,使得检测难度增加。同时,卫星图像分辨率高、帧频快,导致星上信息处理的数据率大,对系统的实时性和稳定性提出了更高的要求。本文的研究目的是设计并实现一个检测性能好、实时性强、稳定性高的星载红外小目标检测系统。研究从红外小目标检测算法优化、算法的FPGA实现和系统接口设计三个方
目的针对老年慢性支气管炎患者的临床护理经验进行分析。方法选取2015年12月~2016年12月本院收治的老年慢性支气管炎患者120例,将其随机分为对照组和研究组,各60例。对照组给
单核苷酸多态性(SNP)是人类基因组中最常见的遗传多态性.通过大样本对照分析,研究人员已发现与重症肌无力(MG)相关的SNP,如何确定这类SNP与MG发生关联的分子机制,成为当前MG研究
构建地方政府腐败风险预警测评指标体系是建立腐败风险预警机制的重要环节。结合我国现阶段腐败的表现形式和特征,提出了构建地方政府腐败风险预警测评指标体系必须遵循科学性
对比分析了教育部2015年颁布的《普通高等学校图书馆规程》与2002年颁布的《普通高等学校图书馆规程(修订)》,指出了其形式上的调整、内容上的更新,《普通高等学校图书馆规程》
<正>2018年10月10日,山西省水利厅在临汾市的隰县,召开了全省水土保持重点工程建设现场会,总结交流"十三五"以来各地水土保持工作的新经验,进一步推动全省水土保持生态建设再
根据重力地质法(GGM),利用南中国海海域内63179个船测控制点水深将测高自由空间重力异常划分为长波参考场和短波残差场,并反演出了该海域112&#176;E—119&#176;E,12&#176;N—20