论文部分内容阅读
随着社会的迅猛发展,高阶数据(比如高光谱图像、彩色图像、视频)频繁出现于诸多现代科学与应用领域。然而,由于采样设备机械故障、数据存储方式不当等不可预测的原因,数据从采集到最终呈现的每一个环节中,都经常地面临着数据缺失问题;而数据的缺失将直接影响到现实应用中数据分析的质量。因此,如何有效恢复缺失数据已成为当前重要的研究热点之一。由于张量在保留高阶数据多模态结构方面具有天然的优越性,许多张量低秩学习方法被广泛用于解决高阶数据补全问题,在线性代数领域也叫张量补全问题。相比于经典的张量低秩学习方法,如CANDECOMP/PARAFAC(CP)、Tucker、Tensor-Train(TT)分解,新近提出的张量环(Tensor-Ring,TR)分解在高阶数据低秩刻画方面表现出了更强的表示能力,成为张量补全领域的重要研究方向。至此,本文基于张量环分解,研究张量低秩理论,刻画高阶缺失数据低秩结构,建立张量补全模型,设计有效的优化算法。具体地,本文的研究成果如下:一、针对传统张量环补全模型的高计算损耗问题,本文提出了有效的基于并行矩阵分解的张量环补全模型。由于传统基于张量环分解的补全模型在优化过程中采用了不平衡的张量展开操作,TR秩的选取往往比较大,在实际应用中容易导致高计算损耗问题。为了克服此问题,本文首先定义了一个平衡的张量展开操作(称为张量循环展开)作用于目标张量,并从理论上揭示目标张量TR秩与张量循环展开的矩阵秩之间存在的关系。通过利用这种关系,本文进一步对所有的张量循环展开作并行低秩矩阵分解,从而挖掘目标张量的低TR秩结构。此外,为有效改善不均匀丢失张量的补全效果,本文首次在张量循环展开中引入了行权重方法。大量实验比较结果表明,和传统张量环补全模型相比,本文提出的张量环补全模型用小得多的TR秩便能获得当前较好的结果,且复杂度更低。而行权重方法的使用也被验证明显有利于改善不均匀丢失张量补全效果。二、针对张量环补全模型的TR秩选择难题,本文提出了基于张量环核范数的凸补全模型。现存的基于张量环分解的补全方法大都是非凸的,在理论上无法保证获得最优的TR秩;而且,TR秩被定义为一个向量,其选择范围与TR秩维度成指数增长,在实际应用中难以选择到最优的TR秩。针对当前基于张量环分解的补全模型存在的TR秩选择难题,本文提出了基于张量环核范数的凸补全模型。具体地讲,本文利用张量循环展开操作,通过加权组合张量展开矩阵的核范数,首次定义了张量环核范数,并提出了基于张量环核范数最小化的补全模型。由于本文提出的张量环核范数是凸的,且不需要给定TR秩,因此从根本上避免了 TR秩选择难题。大量图像和视频补全实验结果表明,本文提出的方法比传统的张量补全方法在图像和视频补全上表现更好。三、针对张量各模态低秩不平衡问题,本文提出了基于隐张量环核范数的张量补全模型。现存的张量环补全方法大都假定目标张量在所有模态上都具有低秩结构。这一强制性假设使得大部分张量环补全方法在只有部分模态低秩的张量数据上表现平平,无法有效挖掘目标张量低秩结构。为有效解决上述弱点,本文利用张量循环展开操作定义隐张量环核范数,并运用Frank-Wolfe算法最小化隐张量环核范数补全模型。由于在Frank-Wolfe算法框架下有效利用了丢失张量稀疏结构,本文提出的补全方法的时空复杂度远小于其他补全方法。实验结果表明,本文提出的张量补全方法不仅能有效解决张量模态低秩不平衡问题,而且能够以小得多的时空代价获得当前较好的补全结果。四、针对传统张量环补全模型的秩敏感问题,本文提出了低秩稀疏张量环补全模型。当前的大部分张量环补全方法在选取秩大于真实秩时性能容易变差。为了解决这个关键问题,本文通过对张量环核张量作Frobenius范数正则化提出了一个新的低秩稀疏张量环补全模型。我们理论表明,利用张量环核张量的Frobenius范数,本文所提出的张量补全模型能够有效挖掘目标张量的低秩稀疏结构。此外,为有效提高本文提出的张量环补全模型的收敛速度,本文提出了一个有效的初始化算法。和传统的基于张量环的补全方法相比,合成数据和真实数据上的大量实验结果表明,本文所提出的方法在恢复丢失元素值方面具有杰出的表现,而且对秩的选取具有有效的鲁棒性。