论文部分内容阅读
关系图是建立在样本数据基础上的更高层表达形式,是描述样本间复杂联系的基本工具。关系图被广泛的应用在社会科学,生命科学,历史学等诸多领域。随着信息时代的来临,关系图被用来解决各种智能化的问题,例如图像分割,网页搜索,语言情感分析,社交网络分析以及推荐算法等。对于关系图方面的研究具有很强的现实意义。然而,在现实中存在如下两方面因素会导致关系图不能准确反应样本之间的联系:其一,噪声的干扰,数据的变换,人为的误导等因素的影响会掩盖数据本身的规律性信息。其二:关系图构建方式的不合理,关系图构建函数参数选择的不恰当都会造成关系图中重要信息相对弱化。 针对上述存在的问题,本文做了如下两个方面的工作: (a)关系图矩阵的纯化的低秩稀疏模型(SLSA);其具有对不同影响因素存在下关系图矩阵的纯化作用,从而达到对关系图中真实信息的增强,抑制噪声等其它不相关信息的目的。同时,指出,该模型具有对相似图构造参数的反馈调节的作用,SLSA模型的解可以协助优化关系图建立过程中的参数Θ。通过模拟和真实数据上的数值实验验证了SLSA模型的有效性以及其在参数反馈调节上的作用。 (b)多视角数据的一致化投影模型(UMDS,UCA);UMDS旨在分析数据的视角扭曲性,从而恢复数据背后隐藏变量的一致化表示。UCA通过分析数据的视角扭曲性对相似图关系的影响,从而恢复出一致化的关系图。两种思想出发点不同但最终化为共同形式的非线性特征值问题。给出了该非线性特征值问题基于子空间更新的迭代方法,以及基于子空间扩张的加速算法,并讨论了其收敛性。