论文部分内容阅读
从高维数据中发现与挖掘低维结构信息并加以利用,在计算机视觉、数据挖掘、机器学习、图像处理、音频与视频处理、网络搜索、生物信息学等数据集普遍拥有上千乃至百万维观测空间的科技领域,扮演着越来越重要的地位。利用有限的低维结构信息便可对高维数据进行合理的表示、推断、处理与分析,但这需要假设原始数据具备固有的低复杂度,也即低秩性或特定变换基下的稀疏性等。近年来,在高维信号处理、优化与运筹学、统计概率论、矩阵分析、泛函分析与时频分析等领域研究成果的基础上,诞生了一系列新理论,包括压缩感知(Compressed Sensing,CS)、矩阵填充(Matrix Completion,MC)、稳健主成分分析(Robust Principal Component Analysis,RPCA)等。这些理论充分利用了高维数据的稀疏性与低秩性,形成对其有效地降维表示,并能通过凸优化法精确地重建原始高维数据。 本文首先系统地讨论了数据的稀疏性与低秩性及两者之间的关系,并指出通过稀疏表达与低秩矩阵构建的方式可以分别达到数据稀疏化与低秩化的目的。CS理论指出,只要信号是可压缩的或在某个变换域是稀疏的,那么就可以用一个与变换基不相关的观测矩阵将变换所得的高维信号投影到一个低维空间上,然后通过求解一个优化问题就可以从这些少量的投影中以高概率精确重构出原信号。作为CS理论应用的前提,稀疏表达经历了从变换到基于冗余的过完备字典的原子分解阶段。如何构造合理有效的字典,以使得字典中的原子尺度和结构特性与图像或信号中的结构内容相匹配,是稀疏表示的关键问题。与由固定变换基生成的字典相比,通过字典学习的方法可以获得同图像结构特征相匹配的自适应字典,进而形成对图像最优的稀疏表达,从而保证稀疏重构的精度。文中给出了正交基字典的构造方法,并重点研究了典型的字典学习算法(K-Singular ValueDecomposition, K-SVD)。 基于学习型冗余字典的图像或信号稀疏表示,充分利用了字典原子的自适应性,进而构成对图像主要结构特征的最优表达。字典学习过程蕴藏着强大的鲁棒性,能够有效抑制噪声或误差及修复缺失信息,本文研究了自适应的过完备稀疏表达在图像复原中的应用。通过基于图像块的稀疏编码与字典学习以及求取均值的策略,冗余的过完备稀疏表达法能够有效去除图像中的高斯噪声。本文接着提出了一种基于部分正交匹配追踪(Partial Orthogonal Matching Pursuit,POMP)算法和K-SVD字典学习的策略来进行图像修复,并将其用于遥感影像厚云去除,结果表明此法能有效恢复出原始影像信息,并且能够保持图像结构与纹理信息的连贯性。 MC理论面向的是利用少量的采样矩阵元来精确重构原始低秩矩阵信息的问题,而RPCA则解决的是从存在大幅值稀疏误差的观测矩阵中恢复出原始低秩矩阵的问题。从数学角度讲,MC与RPCA都可以归结为低秩矩阵重建问题,本文分别创新性地开展了这两个问题在遥感影像低秩信息重建中的应用研究。首先提出了一种基于MC的遥感低秩信息复原方法,使用“确定性采样”与“热启动技术”,利用奇异值阈值(Singular Value Thresholding,SVT)收缩算法进行MC重构。该方法对于因污染、破坏或遮挡等原因造成的信息缺损问题的复原处理效果占优,其在信息复原的同时能较好地保留细节纹理信息。对于RPCA,本文将其成功用于影像低秩背景或稳定信息与显著目标或突变信息的分离实验,并指出其在遥感影像变化检测及稀疏目标提取中的应用潜力。 基于MC与RPCA问题,本文定义了稳健矩阵填充(Robust MC或MC fromCorrupted Samplings,MCCS)问题,也即从非完全且存在稀疏误差的采样矩阵元中精确恢复出原始低秩矩阵;同时,我们通过最小化核范数与l-范数的组合构建了其相应的最优化模型,并提出了一种新颖的拓展分部拉格朗日乘数(Augmented Subsection Lagrange Multipliers,ASLM)法来求解此类最优化问题。通过将其应用于低秩影像中混合高斯椒盐噪声去除的问题中表明,此算法对于具有规则纹理及相似结构内容等低秩特征的影像中混合噪声的去除效果较好,其能够同时去除影像中的脉冲与高斯混合噪声,且有效保留影像中的纹理细节等信息;当影像中椒盐噪声密度较高而高斯噪声相对较小时,其去噪效果优势更明显。