信息增强的子空间聚类算法研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:liu7605136
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
“大数据”时代,我们需要面对大量高复杂度、高维度数据的分析处理,例如丰富多彩的图像和视频、文本等。一些研究表明,这些数据样本所分布的高维空间,往往存在着低维结构,可以用一系列低维子空间的集合进行有效近似。将各个数据样本按照其潜在低维子空间结构进行有效划分,称之为子空间聚类问题。近些年来,子空间聚类算法已经成为当前聚类分析研究的热点问题之一,涌现出许多子空间聚类算法,其中基于谱聚类的子空间聚类算法变得越来越流行。这类方法主要分为两个步骤:第一步,从数据样本中学习其相似度度量;第二步,对相似度矩阵应用谱聚类算法,得到一个合理的数据划分。然而由于缺少有效的特征抽取以及没有应用相关的增强信息,子空间聚类算法应用范围较为有限。本文从探索挖掘数据样本增强信息角度,提出了信息增强的子空间聚类算法研究,开展如下几个方面的创新性工作:(1).本文提出了一种低秩结构化稀疏子空间聚类算法(Low Rank and Structured Sparse Subspace Clustering,LRS3C)。基于低秩表示模型,通过探索挖掘数据样本的结构化稀疏信息,融合到子空间聚类的自我表示模型优化过程中,构建一个信息更丰富的相似度矩阵;此外,建立起自我表示模型与谱聚类算法之间的相互联系,形成了一个联合优化框架,应用线性交替方向法(LADM)进行优化求解。在两个基准数据集上验证了所提出LRS3C算法的有效性。(2).本文提出了一种块对角先验增强深度卷积子空间聚类网络(Convo-lutional Subspace Clustering Network with Block Diagonal Prior,ConvSCN-BD)。通过探索块对角先验信息在子空间聚类相似度学习中的增强作用,融合到自我表示模型的优化过程中,构建一个具有块对角结构的相似度矩阵。此外,ConvSCN-BD网络基于卷积自编码网络进行特征抽取,学习得到符合低维子空间结构的有效特征,从而更好进行子空间聚类学习。在三个基准数据集上的实验验证了ConvSCN-BD网络的有效性。(3).本文提出了一种自我监督深度卷积子空间聚类网络(Self-Supervised Convolutional Subspace Clustering Network,S2ConvSCN),将卷积模块(用于特征学习)、自我表示模块(用于相似度学习)、谱聚类模块(提供自我监督信息)联合成为一个端到端可训练的网络框架。通过将子空间聚类结果反馈回来,形成一种对子空间聚类网络的双重自我监督机制。具体来说,将网络优化过程中生成的聚类结果视为一种聚类分析的后验信息,周期性反馈回来,作为伪标签使用,监督指导子空间聚类网络自我表示模块与特征抽取模块的优化训练。在四个基准数据集上的实验,证明了子空间聚类网络双重自我监督机制的有效性,并证明我们提出方法的优越性能。(4).本文提出了一种辅助信息增强的约束稀疏子空间聚类算法(Con-strained Sparse Subspace Clustering with Side-Information,CS3C+)。在一些实际应用中,往往存在着用来指示成对数据样本“必须连接”或“不能连接”关系的相关信息,称之为数据样本的辅助信息。探索挖掘辅助信息对子空间聚类学习的增强作用,将部分可用辅助信息编码为一个权重矩阵,加入到自我表示模型的学习过程中,用以鼓励“必须连接”数据样本之间的相似度,抑制“不能连接”数据样本之间的相似度,从而学习得到更好的相似度度量。此外,辅助信息也融合到谱聚类过程中,形成了一个子空间聚类自我表示模型与谱聚类算法的联合优化框架。在三个癌症基因基准数据集上的实验,验证CS3C+算法的有效性。
其他文献
机匣是航空发动机中常见的零部件类型,用于支撑转子、固定静子、流道围形等用途。对于航空发动机,推重比、油耗等主要指标均直接与结构重量相关。为此,机匣的轻量化设计方法
光合作用中的高效率的能量吸收和转换是光合作用研究中最关键的问题。在弱光条件下,光合作用系统中能量吸收和转化效率可以达到95%。理解如此高效的能量吸收和转化效率需要使
重庆巫山地处三峡库区腹心,是国家生态文明示范县。近年来,该县深入贯彻习近平总书记在十三届全国人大一次会议重庆代表团参加审议时的重要讲话精神,深学笃用"两山论",持续将
新中国成立后,派驻监督制度首先在政府监察体系中建立起来,1959年监察部撤销后,1962年党内派驻监督制度开始建立并在实践中得到初步发展。党的十一届三中全会后,党的纪检派驻
目的:分析老年食管鳞状细胞癌(Esophageal Squamous Cell Sarcinoma,ESCC)患者的临床病理特点及预后因素,结合相关不良反应,探讨其治疗方式,为临床工作中更准确的评估其预后、
本文介绍了一种新的参数化设计方法,综合运用参数化软件、物理性能分析软件和结构性能分析软件,最终得到在不同评价模式下的最优解,是一种基于多物理场多目标分析进行建筑结构优化设计方法。研究选取上海中心大厦为案例模型,首先在可视化编程软件Grasshopper下建立参数化模型。再针对影响因子太阳辐射、重力、风分别进行单目标优化设计。首先通过Ecotect软件和Geco插件进行太阳辐射分析,进而通过数据处理
随着社会经济的发展,妇女更多的参与了社会经济活动,并起着越来越重要的作用,就业创业对于不同时代、不同阶层和不同年龄的女性而言具有不同的意义,尤其是,对于那些经历了十
2010年,体育舞蹈首次成为第16届亚运会正式项目,中国体育舞蹈代表队包揽该项目全部金牌,2019年,体育舞蹈成为即将举行的第二届全国青运会正式项目,体育舞蹈近几年成为了一项
《小世界》和《围城》分别是英国著名作家戴维·洛奇和中国著名作家钱钟书的经典之作。《围城》通过方鸿渐回国后丰富曲折的经历,生动地揭示了一批中国知识分子在事业和情感问题上所面临的困境,揭示了生活的社会心理是一座“围城”,是中西文化氛围中现代知识分子的精神危机。在《小世界》里,小说中的学者仿佛整天忙于学术,可是他们又都在追逐名利。他们飞遍世界寻觅各类乐趣和新鲜事物。这两部小说的故事线索和主题思想非常相似
当前,教育正在经历从“以教为中心”向“学为中心”的范式转变,其焦点为“核心素养”、“课堂变革”和“深度学习”。然而,作为素质教育的一个重要突破口,问题解决教学尽管对