基于邻域信息的谱聚类应用研究

被引量 : 0次 | 上传用户:milamiya2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类分析是人们探索认识事物之间内在联系的重要手段,它广泛的应用在数据挖掘和信息检索等领域。即使在没有任何先验知识的情况下,聚类算法也可以从海量数据中找到有价值的信息。谱聚类作为一种高性能聚类方法,它已广泛应用于计算机视觉、语音识别、文本挖掘等领域。谱聚类的本质是将聚类转化为图的最优划分,其理论基础是图论中的谱图理论,它是一种点对聚类算法,很适合于数据聚类问题。与传统的聚类算法相比,谱聚类算法可以聚类任意形状的样本分布,并且能够收敛到全局最优解,同时还能避免由于数据的过高维数所造成的奇异性问题。对于谱聚类算法而言,聚类的过程就是利用谱图理论对相似矩阵进行划分的过程,其一般步骤是首先利用相似性度量函数构造样本的相似性矩阵,然后计算它的拉普拉斯矩阵,接着对拉普拉斯矩阵进行特征分解,得到其对应的特征值和特征向量,最后选出所需的特征向量并对其进行聚类,即可得到对应数据点的聚类类别。由此可见构造相似矩阵是谱聚类算法中非常重要的一步,相似矩阵构造的好坏直接影响聚类的结果。所以怎样构造一个好的相似矩阵成为了谱聚类算法的研究热点。本文首先介绍了谱聚类算法的基本原理,以及传统的谱聚类算法及其分类,并且分析了目前在谱聚类算法的研究中存在的问题和面临的挑战。然后以邻域信息的利用为切入点对谱聚类算法做了以下两方面的研究。(1)提出了一种基于邻域信息的模糊谱聚类算法。该方法在构造谱聚类算法的最后一步操作时,采用模糊局部信息C均值(FLICM)聚类算法。FLICM算法是在模糊C均值(FCM)算法的基础上加入邻域信息,通过对样本点邻域信息的充分利用,很好的克服了数据集中噪声点对聚类的影响。我们将FLICM算法引入到谱聚类中,提高了谱聚类算法的抗噪性能。通过实验分别在UCI数据集上和遥感图像的变化检测中验证了算法的可行性和有效性。(2)提出了一种基于双边融合的谱聚类算法。在谱聚类算法中,构造相似矩阵是非常重要的一步,相似矩阵构造的好坏直接影响到聚类的结果。该方法首先分别构造差相似矩阵和邻域差相似矩阵,然后利用双边融合的思想将两个相似矩阵进行融合,得到的融合相似矩阵充分利用了像素的邻域信息和自身的灰度信息,更好的抑制了噪声点的影响。我们将该方法应用于遥感图像的变化检测中,实验验证了改进后的谱聚类算法在聚类准确性上明显优于传统的谱聚类算法。
其他文献
地源热泵技术作为可以有效利用可再生能源的一项节能技术,契合了国家可持续发展战略目标,如今已得到越来越多的关注。土壤初始温度作为计算地热源热泵地下换热动态过程的初始条
磷酸替米考星是美国礼来公司于20世纪80年代开发的新型大环内酯类动物专用抗生素。其对多种病原,尤其是畜禽呼吸系统疾病效果显著。该药自90年代陆续在日本、欧美及中国等上
随着信息技术的飞速发展,计算机网络已经渗透到人们生活和工作的各个方面,正在逐步成为人们获取信息和交流的主要工具。网络上的各种设备,包括路由器和交换机等,都进入了一个空前
本文通过典型住区的大量调研,从区位交通、居民构成、设计施工、设施配套等方面入手,对南京市的经济适用住房做出了一定的探讨和总结,同时揭示其现存的种种问题与不足。
目的:探讨碘克沙醇对于肾功能不全大鼠肾损伤分子-1(Kidney Injury Molecule-1,KIM-1)水平及肾小管上皮细胞凋亡率的影响。方法:将48只试验大鼠随机分为正常对照组,模型组,碘克
本文研究了背景差方法检测运动目标经常出现的鬼影问题,通过分析前景块边缘区域像素分布,提出了鬼影检测算法。首先,用直方图匹配和平均变化率来衡量前景块边缘区域的像素分
我国的总目标是建设具有中国特色的社会主义社会,城市景观也应以我中华的民族特色而自立于世界景观艺术之林。我们要建设有中国特色、地方风格和适应现代社会生活发展需要的
目的:通过15例临床肠结核的临床表现、实验室检查的结果并复习文献对该类患者的误诊原因进行分析,以提高医师对该类疾病的早期认知、识别,准确诊断,及时治疗的能力,从而减少误诊。
如何提升煤矿医院的经济效益和社会效益,成为了目前管理层需要认真思考的问题。通过对党风廉政建设所做的价值界定,需要从提升医疗服务水平、完善医院内部管理等两个方面,来
<正> 建筑师在从事自身的设计任务的过程中,是需要不断地探索建筑艺术的创作规律,这将有助于提高自己的设计素质和设计水平。 建筑是以其实体和空间形象及人们参与活动共同表