论文部分内容阅读
随着信息技术的飞速发展,在科学研究、工程应用、社会生活的各个领域无时无刻不产生海量数据,这其中往往蕴含着人们难以直接观察到,但同时又非常有价值的信息。与传统独立同分布的假设不同,这些数据之间往往具有相关性。低秩矩阵分析方法为建模和处理这类数据提供了有效手段,因而受到了广泛关注,并在许多实际问题中得到了成功应用,已经成为数据分析的重要工具之一。现有低秩矩阵分析方法仍然存在许多不足方面,如结果可解释性不强、计算稳健性不足等。本论文针对这些问题进行研究,利用快坐标下降技术、贝叶斯方法、误差建模原理、自步学习策略等,提出了一系列具有稀疏性和稳健性的低秩矩阵分析方法,所取得的主要成果包括*:(1)基于块坐标下降技术,提出了新的稀疏主成分分析和非负稀疏主成分分析算法。我们将原始规模较大的稀疏主成分分析问题分解为一系列规模较小的子问题,然后交替求解。由于每个子问题都具有显示解,所提出的新算法简单高效,而且具有很高的计算精度。实验表明,新算法对于稀疏主成分的计算效果优于现有方法。(2)基于贝叶斯方法论与变分推断技术,提出了一种新的L1范数低秩矩阵分解方法。根据L1范数的概率分布解释,我们建立了L1范数低秩矩阵分解的概率生成模型;然后在贝叶斯框架下,使用变分推断计算待估计参数的后验分布。由于贝叶斯方法所具有的自适应正则化作用,新方法可有效减轻现有方法存在的过拟合弊端。此外,由于使用了变分推断技术,所提方法的计算复杂性也比较低。实验表明,新方法具有良好的计算稳健性与计算精度,特别是对于缺失数据的估计显著优于现有方法。(3)基于误差建模原理,结合贝叶斯方法论,提出了一种新的稳健主成分分析方法。针对实际问题中存在的复杂噪声结构,我们使用混合高斯模型对误差进行建模,代替传统稳健主成分分析方法中的单一噪声假设,给出了新的稳健主成分分析概率生成模型;然后在贝叶斯框架下,使用变分推断技术对模型进行求解。实验表明,新方法能够很好地适应各种类型的噪声,并对噪声参数作出准确估计,从而能够较为精确地从含噪观测中恢复出真实低秩矩阵。此外,对于人脸图像、监控视频等实际数据,所提方法能够提取出具有物理意义的噪声结构,这在一些图像处理和计算机视觉问题中有着潜在的应用价值。(4)基于自步学习策略,提出了一种新的低秩矩阵分解计算框架。我们将自步学习中模拟人类学习过程的思想应用于低秩矩阵分解问题,提出从易到难添加数据、逐步进行矩阵分解的计算框架,并将其具体应用到L2范数与L1范数低秩矩阵分解问题。实验表明,新的计算框架有效地提升了低秩矩阵分解方法的计算稳健性,并在运动结构检测、视频背景分离等问题中有着重要应用。