论文部分内容阅读
在大数据时代,人们借助互联网、云计算等先进技术手段产生和获取了各类海量的信息数据。获取到的这些数据通常具有维度高、结构复杂、信息密度低等特点,且通常是不完整的或被噪音干扰的。如何利用这些不完整的信息资源重建原始数据已成为机器学习、协同过滤、数据挖掘、信号处理及计算机视觉等领域的热点问题。近年来,核范数极小化模型广泛地应用于低秩矩阵恢复问题中。然而,该模型忽视了目标矩阵中不同奇异值之间的差异性,导致得到的结果通常是不准确的。另外,近邻梯度算法作为一阶优化算法的典型代表,也广泛地应用在低秩矩阵恢复问题中,然而这类算法在求解大规模矩阵恢复时往往存在时间复杂度过高等突出问题。针对上述这些问题,本文利用观测数据具有稀疏结构或低秩结构等特性,围绕低秩矩阵恢复问题中模型的建立、算法的设计及算法的分析等核心问题进行了深入系统的研究,旨在为低秩矩阵恢复问题的深入研究提供若干理论和算法基础,进一步促进相关问题的解决,主要取得了以下研究成果:1.针对Schatten-q拟范数极小化模型只能得到近似解的问题,本文提出使用Schatten-2/3拟范数逼近秩函数,将基本低秩矩阵补全问题建模为L2/3正则化模型。通过对该模型最优解的一阶必要条件的数学刻画,提出基于不动点思想的迭代算法,并给出其收敛性分析过程及结果。在大量人工和真实数据集上验证了我们所提算法无论是在性能与效率还是鲁棒性上都超过了相关的非凸极小化算法。2.针对核范数极小化模型不能很好地刻画矩阵的低秩结构问题,本文通过构建连续的非凸函数,提出新颖的基于分式Lq正则化的低秩矩阵恢复模型。同时,设计了基于Nesterov优化理论和不精确近邻算子的求解算法,并给出了其稳定性和渐近收敛性分析结果。另外,将所提正则化模型与算法推广应用到低秩矩阵补全、鲁棒主成分分析和低秩张量补全等问题中。大量的实验结果表明,我们提出的模型与算法无论是准确度还是效率都优于其它低秩矩阵恢复模型和算法。3.针对Lq阈值函数仅在q=0,1/2,2/3,1存在闭式解的问题,本文进一步深入研究非凸TS1函数的基本特性,为TS1正则化模型在低秩矩阵恢复问题中的应用提供理论基础。首先,从理论上严格证明TS1极小化问题的最优解亦是秩极小化问题的最优解。随后,提出一个快速、高效的低秩矩阵恢复算法并将其用于图像恢复问题中。最后,通过在大量真实数据上的实验结果验证了所提算法的有效性和实用性。4.针对现有图像去模糊算法收敛速度过慢的问题,本文通过引入一个更加松弛且不满足Nesterov优化理论的的参数序列,提出一个快速高效的收缩迭代阈值算法。理论分析表明,我们所提算法拥有比FISTA和IFISTA算法更快的收敛速率,且生成的序列是渐进正则的。所获理论的正确性得到了大量实验结果的有效支撑。