基于非负矩阵分解的图像聚类方法研究

来源 :河南科技大学 | 被引量 : 0次 | 上传用户:k364709757
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的高速发展,人们在生活和工作过程中会产生数以千计的图像数据,面对复杂的图像数据如何处理成为了一个难题。图像聚类方法能将样本数据根据不同的特征划分到不同的簇中,使相同簇之间相似性尽可能大,不同簇之间相似性尽可能小。近年来,如何正确对图像聚类进行划分,吸引了研究者的关注,许多聚类方法被提出。而非负矩阵分解由于分解后的基矩阵和系数矩阵中所有元素都是非负的,这一特性很好的满足了现实中整体由部分组成的特点,被广泛应用于图像聚类方法之中。本文在非负矩阵分解的研究基础之上,为进一步提高图像聚类性能,提出了以下三种聚类方法,其主要工作和创新点如下:首先,提出一种自适应图正则化非负矩阵分解方法。数据的局部结构信息比全局结构信息更有利于图像分类和聚类,传统的基于流形学习的非负矩阵分解聚类方法通常是通过k近邻图来捕获数据的局部结构信息。然而,这种依赖于原数据得到的近邻图不是最优的,进而影响后续的聚类性能。为了解决上述问题,所提方法把非负矩阵分解和图构造交替迭代进行,自适应地构造权重矩阵,更好地保持了数据局部流形结构信息,在图像聚类实验中取得了不错的聚类性能。其次,提出一种自适应图正则化判别非负矩阵分解方法。为了充分利用数据的类别标签信息,所提方法在上面所提方法的基础上引入数据标签信息作为约束项,将非负矩阵分解扩展为半监督学习方法,确保具有相同标签的不同样本在降维后的新空间中离得更近且不会合并为同一点,具有更好的可表示性。大量的实验表明,本方法在图像聚类中优于其他经典方法的聚类性能。第三,提出了一种保持投影非负矩阵分解方法。非负矩阵分解直接对原始数据进行分解,而原始数据往往包含大量的冗余信息和噪声数据,降低了聚类性能。所提方法首先将非负矩阵分解与主成分分析相结合,在矩阵分解的同时进行数据降维,降低了噪声的影响。其次,为了进一步提高聚类的准确性,所提方法引入流形正则化项以保持数据的局部几何结构信息。实验结果表明了所提方法的有效性。
其他文献
本文研究目的是旨在通过对傅海峰里约奥运会备战中的力量训练方法和手段的选择结合训练周期模式的组合运用,总结出一套羽毛球项目备战大赛期的力量训练思路和方法。采用文献资料法、观测法、数据统计法、比较分析法,总结傅海峰夺得里约奥运会冠军的备战阶段中力量训练的训练周期模式选择、训练计划的安排和训练方法的归纳,并通过奥运会中力量训练在得失分技术应用分析,系统地阐述了羽毛球男子双打项目备战大赛阶段力量训练的训练
目的:探讨验证项痹颗粒治疗神经根型颈椎病(气滞血瘀型)的临床疗效和安全性。方法:将72例于2018年11月至2019年8月在深圳市中医院住院部骨二科住院,西医诊断为神经根型颈椎病,中医诊断为气滞血瘀型颈椎病,选择保守治疗方案并符合纳入标准的患者按照随机数字法随机分配到治疗组和对照组,每组36例,其中治疗组男18例,女18例,平均年龄(44.06±8.61)岁,平均病程(17.71 ±5.91)月;
随着各大智能手机厂商在其手机中增加了NFC(Near Field Communication,近场通信)芯片,近场通信技术正在逐渐的走进人们的生活和应用中。目前NFC还存在数据传输效率低下以及安
目前,高清视频、交互式多媒体等宽带数据业务的迅猛发展需要通信系统具有更高的传输质量和传输速率。在光纤通信系统中,相比强度调制/直接检测(Intensity Modulation and Dir
近年来,中国借壳上市市场十分活跃,但在并购重组中常出现大股东侵害上市公司和中小股东利益的现象。为了减少由于信息不对称带来的交易成本,降低经营情况生变等未来不确定因素带来的风险,证监会颁布的相关管理办法当中明文规定,交易双方在完成重大资产重组实施后,应当在3年内披露其相关资产的实际利润数与利润预计数的差异情况,并就该情况作出业绩补偿承诺。近年来业绩承诺签订数量增多,问题逐渐浮现,意味着有关制度仍有局
政府投资项目,是各级政府运用政府性资金进行固定资产投资的活动,对于推动发展国民经济、改善生态环境、促进政府的公共服务水平提升具有重要作用。政府投资项目不同于一般的投资项目,因为投资主体为政府部门,资金来源具有公共性,因此,对政府投资项目进行有效的监管,保证政府性资金使用的效率,防止腐败现象的发生,具有很强的现实意义。改革开放以来,结合各地区的实践探索,我国逐步建立起一套政府投资的行政监管体制,对于
本论文所研究的大惯性电液张力模拟绞车属于一种张力控制绞车,它可以根据需求对绞车缆绳上的张力进行控制,从而作为一种负载模拟设备来配合被试绞车或对被试缆绳进行张力控制试验。由于该绞车张力控制系统属于一个时变非线性系统,在张力控制过程中系统参数实时变化,并且张力控制时张力绞车、被试绞车以及缆绳之间存在较强的动力学耦合关系,加之张力绞车大惯性负载的影响,会导致绞车张力控制系统的张力控制精度较低、系统的动态
随着技术变革带来的产业升级以及国家对于知识产权的保护力度的加强,新媒体版权市场的规模快速扩大,新媒体版权运营这一行业也应运而生,并逐渐创造更大的价值。北京捷成世纪科技股份有限公司自2011年上市以来快速发展,2015年之前,主要发展音视频技术类业务,2015年之后以收购影视版权运营公司华视网聚为节点,公司提出以“内容版权运营”的战略核心,正式转型为新媒体版权运营的业务模式,企业规模进一步快速扩大,
情感词抽取是文本分析的首要环节,其精度和范围是情感词典构造、文本情感分类和情感强度计算等应用的关键。传统的情感词抽取方法包括基于情感词典的抽取方法、基于语法规则
时间序列的聚类研究是数据分析领域的重要内容,广泛存在于社会生产的各个领域。通过整合事物随时间变化的数据信息,可以探索事物的发展趋势与发展规律,并对事物的变化规律进