基于Schatten-p范数的潜在子空间聚类方法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:aiming5968f
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代的来临,随之而来的是数据的复杂性和多样性,对于传统的聚类算法提出了很大的挑战。在数据挖掘领域中,聚类分析这一块是对高维数据处理的突破口。面对高维数据聚类所带来的难题,子空间聚类算法作为聚类分析中处理高维数据聚类问题的关键技术被提出,并且得到许多研究者的关注。子空间聚类算法在处理高维数据时的有效性已经得到证实,但现有的子空间聚类方法对秩函数的逼近还不够理想,影响了聚类效果。本文针对子空间聚类算法中的函数逼近问题,基于Schatten-p范数,对子空间聚类算法进行了深入研究,主要研究内容包括:(1)研究了Schatten-p范数逼近秩函数的有效性。针对秩最小化问题的研究,为子空间学习寻找更准确的低维表示,分析了Schatten-p范数作为一种常见的秩松弛函数,对低秩矩阵的恢复能力。通过实验验证了Schatten-p范数逼近秩最小化问题的鲁棒性。(2)提出了基于Schatten-p范数的潜在低秩子空间聚类算法。在现有的子空间聚类算法中,潜在低秩表示的子空间聚类能够包含隐藏数据样本,解决了低秩表示样本不足的问题。在潜在低秩表示中,寻找矩阵低秩解是一个难点。对于秩最小化问题的求解通常采用核范数来近似求解,但是由于矩阵奇异值较大的局限性,核范数不能准确的估计秩函数。为了获得更好的低秩表示矩阵同时能够考虑样本不足的问题,本文用Schatten-p范数作为秩函数的近似表示,提出了基于Schatten-p范数的潜在低秩子空间聚类模型,并且针对误差项引入7)范数增强聚类性能。通过实验分析,验证该算法能够有效提高子空间聚类性能。(3)研究了潜在多视图子空间聚类算法。分析了假设每个视图都来源于一个潜在表示时,如何最大化地利用原始特征的信息。相比于单视图,由于多视图的互补性,潜在表示可以更全面地描述数据本身,从而使子空间表现得更加准确和稳健。本文将Schatten-p范数应用到多视图聚类算法中,通过从多个数据点挖掘潜在的互补信息,并提高低维表示的质量,达到了最大化利用原始特征信息的目的。实验结果表明,在五个数据集上均得到了较好的效果。
其他文献
智慧教室是教育信息化发展的产物,近年来国内外很多学者对智慧教室进行了深入的研究,试图通过智慧教室来优化教学环境,创建新型的教学模式,从而促进教学方式的深刻变革。随着
在组织传播中,新媒体的传播形态以及意见领袖因素会影响到组织员工的行为效果以及组织形象。论文以上海交通大学新进员工为例,选取了上海交通大学一百多名新进员工作为实验受
随着移动数据流量的暴涨,现有的移动通信系统难以满足未来的需求,因此迫切需要研究5G技术。随着对5G技术的研究深入,为保证5G系统信息传输的可靠性,第三代合作伙伴计划(3rd G
液晶是一种介于固体和液体之间的中间相态,液晶将晶体的有序性和液体的流动性结合起来,具有结构自愈修正能力,并能对诸如电场或磁场等外部因素发生响应,已广泛应用于电子器件当中。盘状液晶,多链型液晶是两类重要的液晶化合物,盘状液晶已显示出具有增强载流子迁移率的能力,已发现了多种复杂的微观自组装结构。本文将具有优良光电性质的卟啉、香豆素及BODIPY分别引入盘状液晶、多链型液晶中,希望赋予这三类液晶更加优异
微通道热沉具有结构紧凑、体积小、换热面积大的优点,可以实现小空间内的高效散热,因此在航空航天、国防军事、电子通信等领域有着广阔的应用前景。本文针对高热流密度T/R(Tr
微型反应器(Py、TG等)被广泛用来研究纤维素和半纤维素的热解特性。但是微型反应器的一些缺点不能忽视,如:TG无法提供实际热解中快速的升温速率、Py的热滞后问题、以及它们均不考虑传热传质效应、且无法确定产物产率。这些问题使得由微型反应器得到的关于纤维素和半纤维素的热解规律无法直接用于指导实际的工业生产,所以有必要对其在实验室规模的反应器上的热解特性进行探究。本研究对纤维素和木聚糖在实验室规模固定床
经皮穿刺术作为一种可以有效减轻病人痛苦的活检手术而被人们应用于各种疾病的前期检测中。为提高经皮穿刺术的精度,需要建立一个快速准确的软组织模型。生物组织因为本身复
人工智能研究的是智能行为的机制,它通过构造和评估具有智能行为的人工制品来研究智能。机器学习系统根据环境数据,通过一定的学习方法,获得处理某问题的方法。在机器学习领域中,归纳学习是指给定一个描述语言,智能体根据给定的语言所描述的符号数据,通过一定的搜索方法,获得一个一般概念、规则或理论的过程。归属演算就是可以表示归纳学习过程的一种描述语言,它由计算机科学家米哈尔斯基所介绍,以“属性和属性值的关系”为
车载自组网中,车辆定期广播基本安全信息(Basic Safety Message,BSM)实现车辆协作感知。BSM高可靠性传输保证了安全应用的服务质量(Quality of Service,QoS)。最近,基于干扰
近年来服装纺织业迎来了高速的发展,大批量次的生产对织物表面质量检测显得非常重要。柔印纺织唛作为纺织品的重要辅料,不仅记载着用料成分比例,还有保存方法和洗涤方式等信