基于数据表示的子空间聚类算法的研究与应用

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:xxasp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
聚类作为一种无监督学习方式,在机器学习与模式识别领域里得到广泛地应用。传统的聚类算法是基于距离度量数据之间的相似性。然而如今步入大数据时代,高维数据普遍地存在于各个领域。而高维数据内存在样本与各个簇的距离几乎相等的现象,这使基于距离的传统聚类算法失效。近年来基于表示的子空间聚类算法,如:稀疏表示和低秩表示,凭借在高维数据里优良的聚类性能得到了大量的关注与广泛地应用。本文对子空间聚类算法进行深入地分析探讨,对基于表示的子空间聚类算法存在的问题提出了相关的改进方法,提高了子空间聚类算法的性能。本文的主要工作如下:1、与稀疏表示子空间聚类利用稀疏技术和低秩表示子空间聚类利用低秩技术不同,本文利用Frobenius范数对子空间的表示系数矩阵提出协作表示。Frobenius范数具有分组效应:数据之间的相关性越大,表示系数矩阵内与数据对应的系数越相近,系数值越大。当数据属于同一个簇时,它们之间的相关性比较高,因此对应的表示系数的值较大;而数据属于不同簇时,它们之间的相关性比较低,则对应的表示系数的值较小。这种效应满足子空间聚类对表示系数矩阵的稀疏性要求,并且进一步提高了稀疏的质量。而且协作表示的Frobenius范数求解相比稀疏表示的1范数和低秩表示的核范数相比,其计算复杂度小了很多。2、基于表示的子空间聚类算法中表示系数矩阵构建与图谱分割是两个分开的过程。这两个分离的环节导致算法不能获得系数矩阵构建与图分割之间完整的内在联系。图分割的质量完全依赖于表示系数矩阵的质量,分割结果不能反馈到系数矩阵构建的过程中,无法形成一个闭环反馈。论文提出谱增强:先正则化图谱分割,并将正则项引入到表示系数矩阵构造过程中,力求形成全局最优的聚类结果。再将代表图谱分割结果的指示矩阵融入图拉普拉斯矩阵中,利用其指示性,提高图谱分割的正确性。图像聚类实验和运动分割实验证明了该算法的有效性。3、现有的子空间聚类算法考虑更多的是数据集的全局结构,容易忽略高维数据中潜在的局部的流形结构。本文将流形结构近似等效为其局部切空间结构。先求出切空间的基矩阵,然后线性重构基矩阵等效逼近切空间。再利用稀疏技术进行特征筛选,选择基矩阵的主特征向量,得到稀疏的重构系数矩阵。最后利用稀疏重构系数矩阵构建近邻图。利用近邻图的相似关系来指导系数矩阵的构建和指导半监督学习。论文将数据的先验标签信息通过正则化约束使其在近邻图上流动传递,完成半监督学习。人脸识别实验的结果表明本模型很大程度地提高了子空间聚类的性能。
其他文献
本文针对我国农产品出口贸易的现状、存在问题,具体分析了发达国家对中国农产品所构建贸易壁垒的表现形式,以及对我国农产品出口贸易的影响.立足我国农业国际化发展的新趋势
双轴太阳跟踪器是高倍聚光光伏发电(HCPV)系统中最重要的设备,其跟踪偏差对系统的发电效率影响十分显著。太阳跟踪器在重力载荷与风载荷的作用下发生结构变形,其运行过程中推
近几十年来,生物信息学实验手段和研究方法的不断突破和数据存储技术的快速发展使得领域内实验数据及相关研究文献呈现爆炸式增长。如何从规模日益增大的网络数据库中快速有效
目的对比分析CT血管成像(CT angiography CTA)和超声心动图两种检查手段在儿童肺静脉异位引流诊断(anomalous pulmonary venousdrainage, APVD)中的应用价值,并对漏诊误诊的病例进
随着公共交通事业的飞速发展,自动扶梯已经成为人们日常生活中不可或缺的重要交通工具。自动扶梯的梳齿板安全开关失灵、扶手带和梯级运行不同步、梯级加减速异常、制动失灵
在现实生活中,钢丝绳应用广泛,其运行状况关乎人员、设备安全。加强对丝绳检测设备的研发,把无线通讯技术应用到实际检测中利于解决钢丝绳现场在线检测时出现的各种问题,具有
永磁同步电机与其他电机相比,可以减小体积、增加功率因数。同时,随第三代稀土永磁材料钕铁硼的兴起,永磁同步电机的应用范围越来越广泛。由于在永磁同步电机上使用的机械位置传感器由于体积大、故障率高等缺点,在一些环境恶劣的情况下无法使用,因此无传感器技术就这样被提出。无传感器技术主要包括运用在中高速情况下的各种观测器法和运用在低速情况下的高频信号注入法等。本课题着眼于低速情况下的永磁同步电机的控制。在低速
振荡奇异积分算子由下式定义: 这里P(x,y)为R~n×R~n上的实多项式,K(x-y)为一标准Calderón-Zygmund核。首先,在平移不变的情形,上述算子与支于低维流形上的奇异积分有关
当今时代,人才日益成为最核心的竞争力,成为支撑发展的第一要素。交通运输业是社会经济发展的基础性行业,人才的第一要素作用也越发凸显。而深圳作为我国改革开放的前沿城市
随着Web2.0的不断普及和电子商务应用的迅速发展,大规模的在线评价数据不断产生,使用户行为数据分析和用户行为建模成为可能,且具有重要意义。考虑到用户评价数据和评价行为