论文部分内容阅读
随着大数据与人工智能等现代信息技术的飞速发展,以压缩感知与低秩矩阵恢复为代表的传统稀疏恢复方法已无法应对如心理测量、医学成像、计算机视觉、模式识别等众多领域所遭遇的大规模、高维度、结构复杂的张量数据,从而迫切需要建立一套以张量数据为载体的信息处理新模型、新理论和新方法。由此,以张量具有的低秩性为假设前提,以处理一些大数据环境下的实际应用问题为目的的低秩张量恢复技术应运而生。然而,其应用的有效性强烈地依赖于对张量数据的透彻理解,如建立有效可计算的分解策略,定义简单合理的秩函数等。本文依托新近发展起来的张量奇异值分解框架以及相应的张量管秩的定义,探索了低管秩张量恢复的两个典型问题,即高阶压缩感知和张量鲁棒主成分分析。主要工作陈述如下:
在低管秩张量恢复中,考虑测量过程受到加性噪音的扰动以及实际算法设计的需求等因素,提出了无约束的正则化张量核范数极小化模型。基于张量奇异值分解和张量管秩,首次将压缩感知与低秩矩阵恢复中的约束等距性质自然延伸到张量上,定义了张量约束等距性质。同时借助该性质,建立了通过求解正则化张量核范数极小化模型实现低管秩张量鲁棒恢复的数学条件刻画,同时获得了鲁棒恢复的误差上界估计。利用数值实验分析了正则化张量核范数极小化模型中的正则化参数与恢复精度的关系,为实际应用中的算法设计提供了参考。
因为建立的低管秩张量鲁棒恢复的充分条件要求线性测量映射满足张量约束等距性质,所以本文发展和利用适用于张量的高维概率工具,如集中不等式、ε-网、覆盖数等,论证了在某种适当的采样数条件下,元素服从一族广义的次高斯分布的随机测量总体将以高概率地满足张量约束等距性质,具体包括零均值的高斯分布、对称伯努利分布以及所有零均值的有界分布等。与张量的自由度相比较,所获得的最小可能采样数达到了阶数最优。最后,设计了一系列的数值实验验证了该采样数是合理可行的。
研究了低管秩张量恢复中最本质的仿射管秩极小化模型,回答了一个重要的理论问题,即:采样数满足何种要求时可以保证利用任意可计算或不可计算方法都能够以概率1地精确恢复低管秩张量。基于线性代数、微分流形、集合论等理论和方法建立了张量管秩极小化模型解的唯一性保证,亦即提供了低管秩张量的一致恢复和非一致恢复所需的最小采样数估计,这两个基准结果对于判断包括张量核范数极小化方法在内的不同替代恢复方法所付出的采样数代价是否合理有着重要的理论意义。
张量主成分追踪是处理张量鲁棒主成分分析问题的有效方法之一。然而在实际应用中,这种方法需要满足一些相对严格的张量不相干性条件,并且张量的恢复精度也还有待提高。有鉴于此,本文考虑将张量数据流中部分干净数据的行空间和列空间知识作为待恢复低管秩张量的子空间先验信息,提出了耦合子空间先验的张量不相干性条件和修正张量主成分追踪方法,并利用概率集中不等式和对偶验证等工具建立起了相应的模型理论结果,证实了子空间先验信息不仅可以明显弱化相应的恢复条件,而且能够显著提升张量数据的重建质量。在仿真数据、真实彩色视频以及人脸图像数据上的数值实验结果验证了所提方法的有效性。
在低管秩张量恢复中,考虑测量过程受到加性噪音的扰动以及实际算法设计的需求等因素,提出了无约束的正则化张量核范数极小化模型。基于张量奇异值分解和张量管秩,首次将压缩感知与低秩矩阵恢复中的约束等距性质自然延伸到张量上,定义了张量约束等距性质。同时借助该性质,建立了通过求解正则化张量核范数极小化模型实现低管秩张量鲁棒恢复的数学条件刻画,同时获得了鲁棒恢复的误差上界估计。利用数值实验分析了正则化张量核范数极小化模型中的正则化参数与恢复精度的关系,为实际应用中的算法设计提供了参考。
因为建立的低管秩张量鲁棒恢复的充分条件要求线性测量映射满足张量约束等距性质,所以本文发展和利用适用于张量的高维概率工具,如集中不等式、ε-网、覆盖数等,论证了在某种适当的采样数条件下,元素服从一族广义的次高斯分布的随机测量总体将以高概率地满足张量约束等距性质,具体包括零均值的高斯分布、对称伯努利分布以及所有零均值的有界分布等。与张量的自由度相比较,所获得的最小可能采样数达到了阶数最优。最后,设计了一系列的数值实验验证了该采样数是合理可行的。
研究了低管秩张量恢复中最本质的仿射管秩极小化模型,回答了一个重要的理论问题,即:采样数满足何种要求时可以保证利用任意可计算或不可计算方法都能够以概率1地精确恢复低管秩张量。基于线性代数、微分流形、集合论等理论和方法建立了张量管秩极小化模型解的唯一性保证,亦即提供了低管秩张量的一致恢复和非一致恢复所需的最小采样数估计,这两个基准结果对于判断包括张量核范数极小化方法在内的不同替代恢复方法所付出的采样数代价是否合理有着重要的理论意义。
张量主成分追踪是处理张量鲁棒主成分分析问题的有效方法之一。然而在实际应用中,这种方法需要满足一些相对严格的张量不相干性条件,并且张量的恢复精度也还有待提高。有鉴于此,本文考虑将张量数据流中部分干净数据的行空间和列空间知识作为待恢复低管秩张量的子空间先验信息,提出了耦合子空间先验的张量不相干性条件和修正张量主成分追踪方法,并利用概率集中不等式和对偶验证等工具建立起了相应的模型理论结果,证实了子空间先验信息不仅可以明显弱化相应的恢复条件,而且能够显著提升张量数据的重建质量。在仿真数据、真实彩色视频以及人脸图像数据上的数值实验结果验证了所提方法的有效性。