论文部分内容阅读
随着科技的快速发展,数据的规模越来越大,而大部分数据都可以被表示为矩阵的形式,换句话说,在实际应用中,矩阵的维数在逐渐的增加。由于数据在储存、传输、压缩或者产生的过程中都难免会受到噪声或者其他因素的影响,所以数据将会面临缺失、损坏以及失真等问题,而这些问题将会严重的影响数据的分析和正确性,为了解决这类问题,矩阵补全技术在数据分析和处理中扮演着非常重要的角色。矩阵补全技术被广泛的运用于图像修复、推荐系统、视频修复、机器学习和计算机视觉等领域。在过去的二十年里,有很多的学者和研究者都在对矩阵补全算法进行了研究和改进,但随着矩阵的规模和尺寸的不断增大,过去传统的矩阵补全算法已经难以满足现代科技的需求了,因为过高的计算成本,导致很多问题的解决方案变得不现实。矩阵补全技术主要分为两个部分:第一部分为矩阵的有用信息和特征提取;第二部分为矩阵的重构。第一部分的设计往往决定着算法的计算复杂度和补全效果。对矩阵的信息进行特征提取,常用的方法有主成分分析(Principal Component Analysis,PCA)和奇异值分解(Singular Value Decomposition,SVD),但这两种方法的计算成本随着矩阵维数的增加是呈现维数平方级别的增长。本文为了避免这种高计算成本的SVD操作,提出了两种新颖的矩阵补全算法,分别是基于快速随机投影的矩阵补全算法(Fast Random Projection Algorithm for Matrix Completion,FRPMC)和基于正交随机投影的矩阵补全算法(Orthogonal Random Projection Algorithm for Matrix Completion,ORPMC),这两种算法都是利用随机投影的方法把高维的数据投影到低维的子空间中,然后再对矩阵进行特征的提取,这方法大大地降低了计算的成本,提高了问题解决的效率。为了更加适应现代科技的发展,本文还在这两种随机投影的矩阵补全算法的基础上延伸出一种处理高维数据的算法--基于正交随机投影的张量补全算法(Orthogonal Random Projection Algorithm for Tensor Completion,ORPTC)。在文章中,本文设计了几组仿真数据实验,验证了这两种矩阵补全算法的功能和效果,也设计了几组黑白图像恢复的实验来验证了这几种算法的补全效果。实验的结果也表明了,FRPMC和ORPMC算法的综合表现均比传统的矩阵补全算法好,就如与经典的基于奇异值阈值法(Singular Value Thresholding,SVT)的矩阵补全算法相比,三者对图像恢复的精度相近,但FRPMC和ORPMC算法在运行速度上分别比SVT算法快了10倍和5倍以上。为了验证拓展延伸的ORPTC算法的可行性和有效性,本文设计了一个彩图恢复的实验,与ORPMC算法相比,虽然ORPTC算法的运行速度不如ORPMC,但ORPTC对彩图的恢复精度比ORPMC高。