矩阵变量稀疏表示与鲁棒低秩方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:ppp9904140
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机器学习方法通常分为有监督学习和无监督学习。分类器是有监督学习中的研究热点之一,子空间分割是基于子空间学习的聚类方法,属于无监督学习。机器学习的研究对象是数据,而涉及数据就必然避不开数据形式,数据污染等问题,不管是分类问题抑或是子空间分割问题都会受数据中的噪声影响。如何处理受污染数据是一个公认的难题。本文从统计推断的角度出发,将噪声估计看成一个鲁棒回归问题,结合目前前沿的稀疏表示分类器和低秩子空间聚类理论,提出了新的分类器和子空间分割算法。本文的主要工作包括以下几个方面:  (1)本文提出了一种矩阵变量的稀疏表示方法,并将其应用于人脸识别。传统稀疏表示分类器是将输入图片转换成向量作为输入信号,然后再用一部分向量字典对图片进行编码,这个过程中通常不考虑图像的结构信息。本文直接用图像数据作字典来表示图像本身,通过假设图像数据中的误差矩阵服从某一种矩阵变量的椭圆分布,采用贝叶斯理论对误差进行误差估计,得到一个核范数正则化的稀疏表示模型。该模型对退化的,不独立的噪声鲁棒。这是因为模型将矩阵变量的椭圆分布引入图像表示,使得在处理图像数据时能保留图像本身的矩阵形式,获取更多的空间数据信息。本文使用交替方向的拉格朗日乘子法(ADMM)算法求解这个问题,并且在文中给出了算法的收敛性的详细证明。实验在多个人脸数据库上证明了该算法的有效性。  (2)本文在低秩表示的基础上,提出了改进的低秩表示聚类方法。低秩表示是将数据集分解成一组字典的低秩线性组合与一个噪声矩阵的和,通常选择数据集本身作为字典。然而在处理受污染数据的时候,数据本身并不是最优字典,因为其中所含的噪声会影响聚类结果。本文从最优化理论的角度证明了无噪声的数据矩阵是低秩表示的最优字典。根据这个结论,文中提出了学习一个无噪声的低秩表示字典的方法:在求解低秩表示的同时,不断在原数据矩阵中去除当前的噪声矩阵,以保证每一步的计算过程中都不断降低噪声影响,实验表明该算法能有效处理含噪声数据的聚类问题。  (3)本文基于低秩表示聚类,提出了一种鲁棒的低秩表示聚类方法。对于子空间分割问题,有一个基本假设,高维数据集是位于一个或几个不同的低维线性子空间中的。所以子空间分割问题往往会采用低秩表示方法。但是在稳定性方面,低秩表示只能处理异常点或者稀疏噪声。对于块状噪声或者混合噪声污染,低秩表示并不稳定。于是本文提出了鲁棒的低秩表示(Robust low-rank representation,RLRR)来处理混合噪声污染的多维数据集的子空间分割。原先的低秩表示模型是假设数据集中的噪声是稀疏的。从统计推断角度看,也就是假设噪声服从拉普拉斯分布。现实生活中的噪声是以各种形式存在的,并不一定服从拉普拉斯分布或者高斯分布,所以文章把低秩子空间分割问题转化成一个低秩约束的鲁棒回归模型,然后再用最大似然估计来估计数据中的噪声分布,再根据分布预测噪声强度,以此去除噪声对子空间分割造成的影响。实验表明该算法对多类噪声污染数据比较鲁棒。  (4)本文基于鲁棒主成分分析(Robust principle components analysis,RPCA),提出了一种鲁棒的图像修复方法。鲁棒主成分分析假设数据中噪声稀疏,通过最小化噪声的L1范数实现稀疏约束。这等同于假设图像数据中的噪声服从拉普拉斯分布。然而图像数据中的混合噪声并不只有这一种形式,所以本文提出了一种新的概率分布,引入两个可变参数,以此更好地自适应地拟合混合噪声。然后用提出的分布根据噪声强度设置权值,控制噪声对修复结果的影响。再根据图像数据本身的低秩性,将图像分成低秩部分和噪声部分,这样得出的图像可以去除复杂的块状遮挡,极度光污染等混合噪声。实验表明该算法能有效修复图像中的缺失数据。
其他文献
编队重构是实现空间飞行器编队飞行的一项关键技术,也是自动导航和控制的重要研究领域,无论在理论研究还是实际应用上都具有重大意义。本论文针对空间飞行器编队重构问题展开了
为解决何时通信、选择何种方式通信的问题,“呈现信息”应运而生。   呈现信息表达的是用户进行通信的能力和意愿。通过呈现信息的协助,人们可以选择最恰当的时间、使用最合
对等网络技术能够准确高效地提供精确匹配和多关键字查询等简单查询服务,是解决计算机网络中大规模信息资源共享的重要手段。然而随着网络规模的快速增长,拓扑结构多元化及用户
机群是一组协同工作的独立计算节点的集合,作为一个整体对外提供计算资源和服务。大规模数据中心一直是机群应用的重要领域。随着社会信息化程度的不断提高,数据中心开始在商业
在计算机技术发展过程中,模拟一直是一个重要的工具。模拟器是运行在一个平台上的特殊程序,它模拟了另外一个平台所具有的特征。模拟器由于其灵活性,被广泛用于体系结构研究、系
码流错误检测与恢复技术一直是数字信号在信道中传输的研究热点,围绕AVS视频解码容错系统方案,本论文的结构安排如下:   第一章为绪论。   第二章对视频编解码标准的发展
视频是集图像、声音、文字等为一体的综合性媒体。随着互联网技术的发展和网络带宽的提升,网络视频数据量呈爆炸式增长,从浩瀚的视频数据库中检索感兴趣的资源,传统的基于关键词
随着数据通信与多媒体业务需求的发展,研究城市场景室外信号传播特性,建立有实用意义的信号传播模型,能够为无线通信系统设计提供依据,从而提高和改善特定区域的信号覆盖能力。传
二十世纪九十年代以来,数字视频压缩技术被广泛应用于通信、个人计算机、广播电视、消费电子等领域,堪称数字媒体产业的最核心技术之一。以MPEG-2为代表的信源编码标准获得了巨
目前,数字视频编解码技术发展非常迅速。越来越多的新技术被纳入到新的编解码标准中。国际上的H.264以及我国自主开发的AVS就是其中两个最新的标准。H.264标准同MPEG-4 ASP以