基于低秩张量环的高阶数据补全模型与算法

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:zldingkai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着社会的迅猛发展,高阶数据(比如高光谱图像、彩色图像、视频)频繁出现于诸多现代科学与应用领域。然而,由于采样设备机械故障、数据存储方式不当等不可预测的原因,数据从采集到最终呈现的每一个环节中,都经常地面临着数据缺失问题;而数据的缺失将直接影响到现实应用中数据分析的质量。因此,如何有效恢复缺失数据已成为当前重要的研究热点之一。由于张量在保留高阶数据多模态结构方面具有天然的优越性,许多张量低秩学习方法被广泛用于解决高阶数据补全问题,在线性代数领域也叫张量补全问题。相比于经典的张量低秩学习方法,如CANDECOMP/PARAFAC(CP)、Tucker、Tensor-Train(TT)分解,新近提出的张量环(Tensor-Ring,TR)分解在高阶数据低秩刻画方面表现出了更强的表示能力,成为张量补全领域的重要研究方向。至此,本文基于张量环分解,研究张量低秩理论,刻画高阶缺失数据低秩结构,建立张量补全模型,设计有效的优化算法。具体地,本文的研究成果如下:一、针对传统张量环补全模型的高计算损耗问题,本文提出了有效的基于并行矩阵分解的张量环补全模型。由于传统基于张量环分解的补全模型在优化过程中采用了不平衡的张量展开操作,TR秩的选取往往比较大,在实际应用中容易导致高计算损耗问题。为了克服此问题,本文首先定义了一个平衡的张量展开操作(称为张量循环展开)作用于目标张量,并从理论上揭示目标张量TR秩与张量循环展开的矩阵秩之间存在的关系。通过利用这种关系,本文进一步对所有的张量循环展开作并行低秩矩阵分解,从而挖掘目标张量的低TR秩结构。此外,为有效改善不均匀丢失张量的补全效果,本文首次在张量循环展开中引入了行权重方法。大量实验比较结果表明,和传统张量环补全模型相比,本文提出的张量环补全模型用小得多的TR秩便能获得当前较好的结果,且复杂度更低。而行权重方法的使用也被验证明显有利于改善不均匀丢失张量补全效果。二、针对张量环补全模型的TR秩选择难题,本文提出了基于张量环核范数的凸补全模型。现存的基于张量环分解的补全方法大都是非凸的,在理论上无法保证获得最优的TR秩;而且,TR秩被定义为一个向量,其选择范围与TR秩维度成指数增长,在实际应用中难以选择到最优的TR秩。针对当前基于张量环分解的补全模型存在的TR秩选择难题,本文提出了基于张量环核范数的凸补全模型。具体地讲,本文利用张量循环展开操作,通过加权组合张量展开矩阵的核范数,首次定义了张量环核范数,并提出了基于张量环核范数最小化的补全模型。由于本文提出的张量环核范数是凸的,且不需要给定TR秩,因此从根本上避免了 TR秩选择难题。大量图像和视频补全实验结果表明,本文提出的方法比传统的张量补全方法在图像和视频补全上表现更好。三、针对张量各模态低秩不平衡问题,本文提出了基于隐张量环核范数的张量补全模型。现存的张量环补全方法大都假定目标张量在所有模态上都具有低秩结构。这一强制性假设使得大部分张量环补全方法在只有部分模态低秩的张量数据上表现平平,无法有效挖掘目标张量低秩结构。为有效解决上述弱点,本文利用张量循环展开操作定义隐张量环核范数,并运用Frank-Wolfe算法最小化隐张量环核范数补全模型。由于在Frank-Wolfe算法框架下有效利用了丢失张量稀疏结构,本文提出的补全方法的时空复杂度远小于其他补全方法。实验结果表明,本文提出的张量补全方法不仅能有效解决张量模态低秩不平衡问题,而且能够以小得多的时空代价获得当前较好的补全结果。四、针对传统张量环补全模型的秩敏感问题,本文提出了低秩稀疏张量环补全模型。当前的大部分张量环补全方法在选取秩大于真实秩时性能容易变差。为了解决这个关键问题,本文通过对张量环核张量作Frobenius范数正则化提出了一个新的低秩稀疏张量环补全模型。我们理论表明,利用张量环核张量的Frobenius范数,本文所提出的张量补全模型能够有效挖掘目标张量的低秩稀疏结构。此外,为有效提高本文提出的张量环补全模型的收敛速度,本文提出了一个有效的初始化算法。和传统的基于张量环的补全方法相比,合成数据和真实数据上的大量实验结果表明,本文所提出的方法在恢复丢失元素值方面具有杰出的表现,而且对秩的选取具有有效的鲁棒性。
其他文献
利用厌氧发酵技术从剩余活性污泥(WAS)中回收挥发性脂肪酸(VFAs),从而为生物脱氮工艺(BNR)提供碳源,该方法为剩余污泥的处理处置提供了一种具有经济效益和应用前景的技术手段。其中
近年来,我国城市居民的交通文明素养与城市交通建设发展水平之间依然存在一定差距,交通违规、违法行为和交通陋习等交通失范行为仍屡见不鲜。本论文依托于国家自然科学基金《
性信息素对于昆虫的求偶和交配行为至关重要,对于鳞翅目昆虫,性信息素通常由雌虫释放,雄虫可以在远距离识别这些化学物质并通过其定位雌虫。由于性信息素高度物种专一和环保
随着我国公路建设的迅速发展,对公路养护和旧路改扩建的需求迅速扩大。路面是公路养护及改扩建工作的核心内容,快速、有效掌握路面几何参数和公路路面技术状况及其变化趋势是
国家文化软实力是综合国力的重要组成部分,系指一个国家通过政治制度的吸引力、文化价值的感召力和国家形象的亲和力等传递与表达出来的影响力。古往今来,任何一个大国的发展
空调系统的能耗对建筑节能具有重要意义,其广泛应用于夏季制冷除湿和冬季制热,空调系统的节能不仅可以降低建筑能耗,也符合低碳建筑的发展要求。研究表明:表面有微纳米结构的
表面涂层可有效减少刀具的切削磨损、提升加工效率以及加工质量,已成为金属切削领域的研究重点。作为一种典型的刀具涂层,AlTiN具有良好的硬度和热稳定性,已成功在工业上获得
自20世纪90年代以来,随着GPS技术的飞速发展,对国民经济生活和科学研究都有着巨大的影响。我国于“十一五”期间投资建设了国家重大科技基础设施“中国大陆构造环境监测网络
伦理是人际关系的产物,伦理学是研究人的道德行为的学问,而文学伦理学批评则是伦理学视角下进行文学批评的方法。文学和伦理学对人的共同关注构成了两个学科的交叉点,并在此
随着互联网的广泛普及和信息技术的迅猛发展,高维数据已经广泛出现在自然科学和社会科学等领域中。在高维数据中,变量之间往往具有一定的相关性,如何刻画这种高维相关性的特