论文部分内容阅读
许多自然信号通过合适的基变换后都有简洁的表示,而且可以把这些简洁的表示精确地还原为原始信号,如图像的小波变换,窄带信号的傅里叶变换,低秩矩阵的奇异值分解,等等。近年的研究表明,如果原始数据具备特定变换基下的稀疏或低秩性,那么利用这种性质可以对高维数据进行合理的表示、推断、处理与分析,即稀疏重建与低秩矩阵复原技术。稀疏重建与低秩矩阵复原技术广泛地应用于高维稀疏信号的重建,图像缺失像素的复原,广告推荐系统中低秩矩阵未知元素的补全,计算机视觉中基于稀疏/低秩表示的目标检测与跟踪,机器学习中稀疏/低秩子空间的聚类等等多个领域。本文研究了稀疏重建与低秩矩阵复原技术的建模和求解算法,在以下几个方面具有创新性成果:1)在阵列信号处理领域,把基于稀疏重建的点源波达角估计算法扩展到分布式信号源。传统的点源波达角估计算法如MUSIC,ESPRIT,通常需要对关键参数做运算量较大的谱峰搜索。近年来,有学者利用点源在空间分布的稀疏性,把波达角的谱峰用稀疏重建的方法获得,显著减少了运算量。由于远场的分布式信号源在整个角度空间上也具有稀疏的特点,本文尝试了把稀疏重建的方法应用到分布式信号源。传统的分布式信号源波达角估计算法也有运算量大的缺点。此外,不同于点源,它们还需要假设某种确定的角信号密度函数和角功率密度函数,如高斯分布、均匀分布和三角分布等。这两个函数表示信号源的空间分布特征,在实际中不一定能预知。因此,分布源的估计通常只是估计中心到达角和分布参数,不能获取真实的分布曲线。本文提出一种估计分布式信号源空间分布曲线的算法,把分布曲线视为需要重建的稀疏向量,从稀疏重建的角度进行建模和求解。不同于现存算法,我们的算法能得到整个空间分布曲线,信息量比原有算法得到的中心到达角和分布参数更为丰富和全面,而且运算量小。2)提出了一种允许正则项为非凸非平滑的稀疏和低秩组合模型。许多现有算法只允许利用稀疏和低秩两种性质中的其中一种,两种性质并存的情况由于应用场景少而没有得到重视。少数算法虽然研究了两种性质并存的情况,但为了简化模型通常假定正则项为凸的。然而,在实际应用中,稀疏和低秩两种性质并存的情况是存在的,例如广告推荐系统中用户-物品评分矩阵,子空间聚类问题中估计具有块对角结构的协方差矩阵。此外,近年的研究已经表明,非凸的正则项可以更好地获得稀疏/低秩性。针对这种情况,本文提出了一种更通用的稀疏和低秩模型框架,不仅允许稀疏正则和低秩正则同时存在,而且正则项还可以是非凸,非平滑的,弥补了现有研究中针对这类特定情况的空白。为克服非凸正则项导致的需要双重迭代求解,运算量过大的问题,我们把近年提出的凸优化技术“近似平均法(proximal average)”扩展到了该模型中,该技术在每步迭代中计算的是近似的解,能够使算法避免一层内部迭代,从而减小了主循环单步迭代的复杂度。我们证明了,虽然每一步使用的解只是一个近似值,但它会逐步收敛到问题的真实解。我们还探讨了这种非凸模型如何避免陷入局部最优解的问题。3)提出了加速的加权核范数优化算法,能高效地求解Schatten-p非凸优化模型。Schatten-p非凸优化模型是一种低秩矩阵复原模型,而加权核范数优化算法是近年一些学者提出的用于求解该模型的算法。我们通过分析加权核范数优化算法,从数学上证明了该算法本质上是一种块坐标下降法的特例。同时我们发现,原算法其中的一个重要步骤可以归结为求解一个子优化问题,而原算法在这一步骤使用的并不是该子问题的最优解,还存在改进空间。基于这种理解,我们在原算法里改进了这个步骤,使得目标函数在每步迭代都下降得更快,从而得到加速的效果。我们证明了提出的加速版算法同样可以收敛到Schatten-p非凸优化模型的稳定点。实验表明,我们的算法在达到同样精度的前提下,所需要的迭代次数和计算时间都明显地少于原版算法,在某些任务上甚至只需要原算法一半的计算时间,同时也显著地快于其它几个现存算法。