含噪数据的稀疏子空间聚类算法及理论研究

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:freezinghk
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高维数据普遍存在于机器学习,图像处理,模式识别等领域.但高维空间中数据间距离几乎处处相等是很普遍现象,这对传统的以距离来度量数据间相似性的聚类方法形成了巨大挑战.子空间聚类算法作为解决高维数据聚类问题的有效算法吸引了研究者的广泛关注.近年来,基于稀疏表示(SR)和低秩表示(LRR)的子空间聚类算法凭借其优良的性能成为新的研究热点.本文深入研究了含噪数据基于稀疏表示和低秩表示的子空间聚类算法,探究了含噪数据稀疏子空间表示系数恢复理论,提出了基于TL1范数约束的子空间聚类算法.具体研究内容有:第一,含噪数据稀疏子空间表示系数恢复理论研究.针对含噪数据,研究了基于l1范数约束的稀疏子空间表示系数恢复问题.在给定的条件下,证明上述模型的最优解遵循稀疏子空间稳健恢复性质.即含噪数据能够近似地被来自同一子空间中的其他数据点线性表示,或者含噪数据点在其他非同一类子空间中数据点下表示系数的二范数比较小.第二,子空间聚类算法研究.将TL1范数应用于子空间聚类的研究,提出基于TL1范数约束的子空间聚类方法.在无噪音的情形下,证明了优化模型的最优解为具有块对角结构的系数矩阵,这对随后进行的谱聚类提供了理论保证;在有噪声的情形下,它的约束条件等价于以干净数据为字典的优化模型,因而求解出的系数矩阵提高了聚类的精确度.进一步,利用增广拉格朗日—交替方向乘子方法给出该优化模型的求解方法.实验结果表明,基于TL1范数的子空间聚类方法不仅增强了系数矩阵的稀疏性,而且在聚类精确度,对噪音的鲁棒性方面要优于基于稀疏和低秩表示的子空间聚类方法.
其他文献
鉴于学校教务管理工作的工作量和复杂性日益增加,传统的教务软件管理系统已经不能适应现代教务管理的要求。本文通过深入了解高校日常工作中的各个环节,对高校教务管理系统的
针对体育运动的自动分类和运动员隐私问题,提出一种基于热成像数据与Fisher线性判别(FLD)的分类方法.首先,通过热成像相机获取10min的运动视频片段.然后,对于每一帧,通过单应性
公司需要大胆打造属于自己的公司文化,即便这种特立独行的文化看上去像帮派文化。我们先来动动脑:理想的公司义化应该是什么样?员工非常热爱工作,享受工作,不严守工作时间,无
目的 通过对北京市某职业学院一起流感暴发疫情进行调查和分析,为有效防控学校流感暴发疫情提供科学依据。方法 采用现场流行病学调查方法,对北京市某职业学院流感暴发疫情中
初等教育文言文教学中要提倡诵读、疏讲、简析、活练;严防心口分离、笼统不实、空泛牵强、呆板繁难,让文言文这一国粹得以传承。
通过分析目前临床工程师工作中面临的现状,提醒临床工程师在医疗装备管理及维修中注重细节、加强学习,尤其是通过与厂家工程师友好合作,来提高自身业务水平和解决问题能力,为医院
英语作为一种通用语言,其教学在教育改革中备受瞩目,并越来越成为学者们竞相研究的话题。师生互动是英语课堂中一项不可或缺的部分。前人已对英语课堂上的师生互动情况做了较
资源环境承载能力研究从起步到现在经历了理论到实践,单要素到综合评价的发展历程,现已成为我国国土空间规划的刚性约束条件。本研究在对国内外资源环境承载能力发展历史研究
随着人们环保意识的增强以及对周边生活环境要求的不断提高,各类用于城市、广场街道、高等级公路的保洁专用车辆越来越多的出现在人们的视野中。这类工程车辆不仅需要具备一
根据中国裁判文书网的公开资料统计,地名商标专用权的侵权纠纷的数量近年来不断上升,然而司法实践中对地名商标的特殊性仍未有足够的重视。本文旨在理论上探究地名商标限制保