基于潜在空间的低秩稀疏表示子空间聚类研究

来源 :华南理工大学 | 被引量 : 0次 | 上传用户:gj12345678
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的迅速发展,各类移动终端每天都会产生大量高维数据,比如视频图像数据。为了挖掘这些数据的内在价值,通常会使用聚类对这些数据进行初步分析。然而,由于高维数据中包含大量与聚类任务无关的特征,直接使用传统的聚类算法处理这些高维数据可能会引发“维数灾难”问题。幸运的是,子空间聚类算法能够较好地处理高维数据聚类问题,尤其是基于低秩表示或者稀疏表示的子空间聚类算法,因其良好的高维数据聚类表现获得了大量研究人员的关注。然而这些算法也存在一些不足,比如潜在空间低秩稀疏子空间聚类算法在潜在空间中保持高维数据的全局结构不太合理,子空间聚类算法难以处理非线性结构数据等。针对这些不足,本文对现有的算法进行改进,通过理论分析和实验比较证明了所提出算法的有效性。本文的主要工作和创新点如下:(1)针对潜在空间低秩稀疏子空间聚类算法求解的潜在空间保持高维数据的全局结构不太合理的问题,提出了基于图约束的鲁棒潜在空间低秩稀疏子空间聚类算法。该算法能够同时得到一个低秩稀疏表示和一个低维的潜在空间,并使用图约束项来保持原始数据的局部流形结构,以获得具有判别性的潜在空间。为了使模型对噪声鲁棒,该算法使用F范数和7)1范数或者7)2,1范数捕捉噪声和离群样本。大量的实验验证了本文提出的算法相比于其他基于低秩表示或者稀疏表示的子空间聚类算法,具有更加优越的表现。(2)针对(1)无法处理非线性结构数据聚类的问题,将(1)和深度学习结合起来,提出了一个基于图约束的潜在空间深度子空间聚类模型。该模型利用F范数和7)1范数使得表示矩阵具有低秩性和稀疏性,同时利用图约束使得学得的潜在空间能够保持原始数据的局部流形结构。实验验证了该模型能够较好地处理非线性结构的数据集,并且求得的潜在空间能够保持原始数据的局部流形结构。
其他文献
俄罗斯企业收入70%来源于传统产品与服务,20%来源于对传统产品与服务的改善,仅有10%来源于技术创新。虽然近年来随着科技发展,这种情况有所改善,可技术创新带来的收益占比仍
聚类是一种无监督学习方法,能够在没有任何经验信息的条件下发现数据真实分布,这一特性,使得聚类分析备受关注。谱聚类基于图论将聚类问题转化为无向图的图划分问题,相较于传
目前,以智能终端和移动网络为依托的第三代支付风起云涌,面对快速发展的第三方支付业务,以第三方支付为主营业务的相关企业,要有一套科学的、符合企业自身实际情况的绩效考核体系,从而优化企业的人力资源管理体系,调动企业内部员工的积极性,进一步为企业创造更多的价值,最终推动企业的健康、平稳发展。本文以LKL新疆分公司作为研究对象,通过对该公司的组织结构,人员分布以及员工工作状况进行分析评估,找出了目前该公司
随着工业自动化的发展,化工生产过程对故障检测技术的要求越来越高。面对石油钻井过程这类复杂化工过程,传统的故障检测方法存在检测效率低,实时性能差和对噪声的鲁棒性较弱
行人重识别在安防领域有重要的应用,而跨模态行人重识别可以在异质数据中匹配相同身份的行人,可以解决全天候监控的问题。相比于手工设计的特征匹配方法,基于深度学习的跨模
近年来,随着现代医学图像技术的快速发展,医学图像的准确分割对于医生诊断和分析病因非常重要。磁共振(Magnetic Resonance,MR)成像是利用磁共振现象,将电磁波信号经计算机处
关系分类在自然语言处理中是一个关键性热点问题,其对于问答系统、推荐系统和情感分类任务的构建都有非常重要的意义。如果能够有效地挖掘出文本中实体之间的关系信息,这对于
随着互联网的快速发展,图像和视频这种能直观生动地表达信息的信息载体分布在了互联网中的每一个角落。人们对于高分辨率图片和视频的需求随着显示终端的发展越来越强烈,但由
狂犬病(Rabies)是由狂犬病病毒引起的一种急性接触性人畜共患病,又称恐水症,俗称疯狗病。狂犬病的临床特征主要表现为:神经兴奋和意识障碍,继而会因为出现局部或全身麻痹而死亡。病理变化主要特征:非化脓性脑炎和神经细胞细胞浆内出现内基小体。狂犬病病毒呈典型的子弹头状或试管状,直径为75 nm,长度为200~300 nm,大小为12 kb左右。该病毒由11928~11932个核苷酸组成,共编码五种不同
独立的语音识别系统已经基本完善,进入了各个领域,进入了人们的生活中。但是,单单利用语音识别技术能做到事情程度太浅。在机器能听写的情况下,人们自然希望其可以理解,甚至