论文部分内容阅读
时间配准的目标是,在时间坐标上通过时间规整方法减少两个序列之间的距离,从而配准两个时间序列。动态时间规整就是用于时间配准的典型方法之一。近年来,动态时间规整得到极大发展,已广泛应用于计算机视觉和模式识别等领域。但是,现有模型的特征表达能力不足,时间配准性能仍然欠佳。为此,本文有效利用自编码作为正则项,分别从浅层非线性表达和深层表达两个方面,提高动态时间规整的配准性能。本文主要工作为:1.提出非线性自编码正则化典型时间规整模型。动态时间规整及其有效变种模型,特别是典型时间序列规整模型(Canonical Time Warping,CTW),虽然在时间序列配准性能上取得了极大提升,但其线性表达能力仍然有限,性能欠佳。为此,本文提出非线性自编码正则化典型时间规整模型(Autoencoder Regularized CTW,AECTW)。具体为,AECTW结合CTW和非线性自编码正则项,通过明确非线性函数来学习数据中的非线性结构,同时增强低维表达的重构能力。得益于非线性结构和重构表达能力,AECTW能够提高CTW的时间序列配准性能。在合成数据和实际行为识别数据集上的实验结果表明,AECTW在时间序列配准任务上优于基准时间规整模型。2.提出栈式时间配准框架。现有时间规整模型的配准性能极大地依赖于特征表达能力,而它们的所用特征都是浅层的,即利用原始数据或者它们的投影实现序列配准。庆幸地是,近期深度学习研究表明,深层体系更有利于学习有效特征表达。受深层体系启发,本文首次将深度表达引入时间配准模型,提出了栈式时间配准框架(Stacked Temporal Alignment,STA)。相比现有的时间规整模型,STA灵活性更高,不仅能将现有时间规整模型纳入统一架构中,而且以一致的视角理解现有时间规整模型。为平衡时间配准的效能和效率,本文基于STA再度开发了栈式边缘时间规整模型(Stacked Marginal Time Warping,SMTW)。SMTW利用边缘栈式降噪自编码作为正则项来学习鲁棒表达,并通过逐层激励函数捕获原始数据中的非线性结构。在合成数据和人类行为识别数据集上的实验结果表明,相比现有时间规整模型,SMTW获得最好的配准性能,同时时间开销也比较小。这也表明了STA框架的有效性。