基于表示的子空间聚类算法研究

来源 :太原科技大学 | 被引量 : 0次 | 上传用户:chen17981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类作为无监督学习算法的代表,一直以来都是学者研究的重要领域。随着信息技术的发展,如今的数据变得更加复杂。而传统的聚类算法已经无法适用于高维甚至超高维的数据。因此,基于谱聚类的子空间聚类算法应运而生。针对现有的子空间聚类算法的一些问题,本文进行了如下研究:为了降低时间成本,通常会对图像数据进行降维。主成分分析(Principal Component Analysis,PCA)是传统的降维算法。然而,PCA是针对二维矩阵的算法,要求必须将图像压缩后再进行降维。但是此方法会破坏图像本身的空间结构。因此本文引入多维主成分分析(Multilinear Principal Component Analysis,MPCA)算法,利用张量计算,无需对图像进行压缩即可进行降维。实验中在不同的图像数据集上对两种算法进行对比,结果表明使用MPCA降维更加有利于子空间聚类。随着数据量的增加,传统的子空间聚类算法时间成本也越来越高。为了提高效率,本文为稀疏子空间聚类提出了一种基于信息传递的统一框架。该框架主要由两个阶段组成。首先,通过采样选择少量的数据点,利用传统方法计算出部分数据的表示系数。在第二阶段,通过信息传递而非传统方式计算出剩余数据的表示系数,从而提高效率。因此,这两部分集成在一起构成完整的表示系数矩阵,传到谱聚类中以获得聚类结果。此框架具有灵活性和可扩展性。它既可以选择不同的采样方法,还可以扩展到其他子空间聚类算法。在Yale BCrop025、ORL和COIL100数据集上的实验结果证实,此框架不仅可以提高效率,而且可以保证聚类精度。传统的子空间聚类算法一直致力于平衡稀疏性和连通性,但单一的模型非常容易受到噪声的影响。为了更好地平衡自表示系数矩阵的稀疏性和连通性,本文提出了子空间聚类的后处理策略,基于原有算法,对自表示系数矩阵进行剪枝操作。为此,首先将近邻定义为具有更多公共近邻和更高系数的近邻,其中近邻是根据非支配排序算法对邻居进行排序后选择出的。确定近邻后,保留每个样本和其自身近邻之间的关系系数,其他系数归零,从而去除不正确或无用的连接。因此,后处理剪枝策略可以保留子空间内部的连接而去除子空间之间的连接。在实验中,将后处理策略应用在传统图像识别领域和物联网领域,验证了策略的普适性和有效性。实验结果表明,该策略可以减小聚类过程中的噪声影响,提高聚类精度。
其他文献
近年来,颗粒物污染得到持续改善,但其仍然是我国北方地区的首要污染物。研究显示,有机气溶胶(OA)成为我国颗粒物污染的主要成分,探究其来源和形成过程是治理灰霾问题的关键。本研究采用高时间分辨率的飞行时间气溶胶化学形态监测仪(TOF-ACSM)在晋中市某地进行冬季PM2.5在线观测(包括COVID-19疫情期间),分析了该地PM2.5的化学组成,探讨二次有机气溶胶(SOA)形成机制。通过对COVID-
表面织构化能积极改善零件表面的摩擦学性能,通过冷压精密成形的方法制造摩擦副表面织构是一种先进的工业化表面织构制造手段,其核心技术之一就是压印模具的设计与制造。模具的制造水平和工艺代表着一个国家工业化发展的水平,具有表面微细结构的精密模具产品的研究和应用是当前研究的热点,尤其是在微机电系统、航空航天、通讯与电子技术、精密仪器与机械、生物和医疗器械等领域。模具微细结构加工主要采用的技术有电火花加工、电
不锈钢焊带的堆焊层长期处于高温、高压、临氢等恶劣环境中,堆焊层熔敷金属的质量如何,在一定程度上影响加氢反应器等设备的有效使用寿命,因此其质量要求很高。不锈钢焊带自主研制不仅仅具有良好的经济效益,还有利于加速我国节约资源型不锈钢板材产业化的步伐,提高我国高端不锈钢材料的国产化水平,促进国内高端装备制造业的发展。本试验在Q345R母材表面埋弧堆焊不锈钢焊带309L和316L,其中不锈钢焊带309L为过
高线轧机中导辊通常因磨损开裂而失效,而氮化硅陶瓷作为高耐磨材料逐渐被冶金领域应用,本文通过确定最优烧结助剂成分配比和最佳烧结温度,用气压烧结(GPS)制备高耐磨氮化硅基陶瓷导辊,最后通过现场实验测试,对其耐磨性做出评估以验证制备工艺的可行性。研究内容及结果如下:1)通过设计正交实验初步得到Al2O3-Y2O3和Mg O-Y2O3系Si3N4陶瓷的最佳烧结助剂配比和烧结温度范围,对得到的烧结温度范围
多智能体系统凭借其高效率与执行任务多样化特性,解决了诸多实际工作中的难题,在各行各业中也扮演着越来越重要的角色。避障作为多智能体系统的核心研究领域之一,更是受到了科研工作者的高度重视。在障碍物多而复杂的环境中,多智能体系统应用仿生智能优化算法进行有效避障;相比较传统避障算法,仿生智能优化算法提高了避障的时效性与环境适应性,且解决了避障过程中易陷入的局部最小值问题。本文基于仿生优化算法进行多智能体避
云计算作为一种新型的计算服务模态,在新一代信息技术领域得到广泛应用。云计算环境下的安全问题主要包括数据安全存储、数据安全审计和加密访问控制三个方向,作为云计算最重要的应用领域,云数据存储技术得到广泛应用和深入研究。云计算环境下的数据存储主要包括数据持有者、云服务提供商和数据租用者三部分组成,当数据持有者将本地可控的数据资源存储到云端,就失去了对数据完整性和可用性的控制。对于数据持有者而言,云服务提
在信息化时代,社会各领域中的数据都在急剧增长,数据挖掘成为了从数据海洋中挖取有价值数据的有效手段,关联规则作为数据挖掘领域的一个主要研究方法,能在大量的数据中找到事务之间的联系、相关性等。频繁项集生成作为关联规则挖掘的关键步骤,具有较高的时空复杂性。实际环境中数据集往往是动态变化的,为了适应其快速更新,需要通过高效的动态挖掘即增量挖掘对挖掘结果进行维护。多尺度理论可以揭示数据对象的结构和层次特征,
作为可降解生物金属材料,镁及镁合金与人体自然骨的抗拉强度、抗压强度、弹性模量和密度均较为相似,且具有良好的生物相容性和力学相容性。因此,镁及镁合金逐渐成为了最具开发前景的可降解生物材料。本研究工作主要包括三个内容:(1)选择母合金成分以及制备母合金;(2)采用铜模挤压铸造法制备片状的Mg-Zn-Ca-Cu非晶合金,并研究了其组织结构、耐腐蚀性能和抗菌性能,以及不同晶化处理温度对其耐腐蚀性能的影响;
公路货车称重计费的计费方式易造成拥堵,随着交通强国建设的推进,为提升道路服务水平,交通运输部自2020年改为按货车车型进行计费。传统的公路货车车型识别主要有两种方法:一种是在道路面层埋置便携式磁带开关或压电电缆进行车轴数统计,需破除路面层安装维护,严重影响通行效率;另一种则通过高精度的光栅传感器或激光传感器检测进行轴数统计,其受灰尘、积水等影响较大。随着深度学习在目标检测方向的发展,本文提出利用目
煤炭在我国是主要能源,并且煤炭及煤层气储量丰富,煤层气即通常指瓦斯气,通常以吸附态存在于煤的微孔隙煤壁表面,或以游离态、溶解态赋存于煤层中。煤层瓦斯气虽然是一种清洁的自然资源,但同时又是一种有害气体,造成了许多煤矿灾害事故,例如瓦斯爆炸、窒息、突出等。研究煤吸附解吸瓦斯影响规律对于掌握煤吸附解吸瓦斯机理、煤层气的开采和利用、预防和治理煤矿瓦斯灾害具有重要意义。本文对屯兰矿22301回采工作面煤体进