论文部分内容阅读
随着传感器和计算机技术的飞速发展,科学及社会领域的许多数据均展示出多维的结构张量是对这类数据自然而本质的表达方式。张量分解是分析和处理这类多维数据的有力工具,可获得高维数据的低维表示并挖掘出其中的有用信息。近年来,张量的理论和应用正逐渐成为研究的热点,并在模式识别、机器学习、计算机视觉、信号处理等领域获得了广泛的应用。然而,传统的张量分析方法没有充分考虑数据分布内在的流形结构、低秩等特性以及样本标记等信息,在实际应用中效果往往不是十分理想。因此,本文围绕张量的分解及其应用,充分挖掘和有效利用数据分布内在的流形结构、低秩等特性以及样本标记等先验信息,提出了先验约束下的张量分解模型,以获取数据更有效的表示。本文主要创新性的工作有:1.给出了先验约束下的张量分解的一般模型。通过依据先验信息合理构造正则化项、约束条件或者先验概率等方式,引入数据分布的流形结构、低秩等信息以及样本标记信息,以获取张量数据更有效的表示。2.提出了基于谱聚类的自适应张量子空间学习方法。该方法针对无标记数据,考虑数据分布的局部流形结构,首先利用谱聚类方法对数据进行聚类,然后以聚类标记为类别标记寻找一组将高维张量变换为低维张量的投影变换矩阵,使得类间离散度与类内离散度的比值最大,即寻找Fisher准则下的最佳聚类子空间,从而能够得到更具鉴别能力的子空间。多个数据集上的人脸识别实验结果表明了算法的有效性。3.提出了有约束的图正则化非负矩阵和张量分解方法。该算法针对部分标记数据,同时引入“软”、“硬”两种约束条件。“硬”约束条件来自于标记数据,使得具有相同类别的样本具有相同的低维表示。“软”约束条件引入图正则化项,使得对于所有样本数据而言,相似的样本具有相近的低维表示。通过这两种“软”、“硬”约束条件的限制,使得获取的数据的低维表示不仅能够保持本身的局部流形结构而且具有较强的鉴别性。将该方法用于半监督人脸聚类和识别,多个数据集上的实验结果表明提出的方法能够发现具有较强鉴别能力的数据表示,从而提高了聚类和识别性能。4.提出了有监督的高阶张量学习方法。该方法针对完全标记数据,基于投影张量的PARAFAC分解,分别在均方损失函数和ε不敏感损失函数下建立了完全监督的张量分解方法,从而得到了张量岭回归、支持张量回归等张量回归模型。进一步地,为了自适应确定投影张量的秩,即模型的阶数,又提出了基于矩阵?1,2范数正则化的张量学习方法,分别推导了在均方代价函数和ε不敏感损失函数下的最佳秩张量岭回归和最佳秩支持张量回归模型。该方法应用于人脸姿态估计、年龄估计以及三维人体姿态估计,在多个数据集上的实验结果表明提出的张量方法能够得到具有一定空间结构的投影成分,并且相比矢量化方法能有效提高估计性能。5.提出了复张量的稀疏贝叶斯PARAFAC分解方法。针对雷达、声纳阵列信号处理问题,通过引入稀疏贝叶斯先验,建立了稀疏贝叶斯PARAFAC分解模型,并提出了基于变分贝叶斯的模型参数估计方法。将该方法用于MIMO雷达多维到达角估计,以及首次应用于三维水声成像,实验结果表明该方法能够有效提高参数估计的精度和分辨率。