论文部分内容阅读
动态纹理是指描述某种动态景观的、具有时间相关重复特征的图像序列。动态纹理在自然界中广泛存在,比如火焰、烟幕、流动的河流、随风摆动的树叶或者多个目标对象(公路上的车辆或人群)的整体运动。本文的主要研究工作集中在动态纹理识别技术中,基于模型的识别技术研究。
本文首先研究了动态纹理模型。LDS(LinearDynamicSystem)动态纹理模型将每帧图像表示为线性子空间(如主成分分析PCA)中的一点,并用自回归过程来学习子空间上抛物线的动态特性。目前,基于模型的动态纹理识别技术大都采用此模型。然而,由于此LDS模型采用的线性维数约减策略(如PCA),过于简单,使此模型不能捕获复杂的场景变化。因此,本文研究了多子空间的动态纹理模型。此模型采用多个PCA的混合来描述图像流(imagemanifolds)的特征。对于场景变化大的图像,这种流体通常是非线性的,且有它们各自的坐标系统。此模型采用了一种全域坐标模型(aglobalcoordinationmodel),将不同流体的PCA坐标,映射到一个统一的流体坐标系统中。然后,利用此全域坐标模型建立动态纹理自回归模型。
本文接着研究了基于模型参数间距离的动态纹理识别技术。分析了Stiefelmanifolds空间的三种距离:PrincipalAngles、MartinDistance、GeodesicDistance。其中基于Martin距离的识别法相比于基于其他两种距离的识别法来说,识别率要高很多。此外,本文讨论了另一种基于KL(Kullback-Leibler)距离的识别法。它利用了LDS动态纹理模型中图像向量及状态向量的概率分布特征,计算出状态空间的KL距离和图像空间的KL距离,然后以这两种距离为核,利用支持向量机(SVM:supportvectormachine)进行分类,从而识别不同的动态纹理序列。基于KL距离的识别法的识别效果要优于基于Martin距离的识别法。
最后,本文研究了另一类基于模型的识别技术:基于模型变量的脉冲响应的动态纹理识别法。此算法运用了动态纹理的一种简单而有效的特征,来进行识别。这种特征基于估计出的动态纹理模型变量的脉冲响应。此脉冲响应能捕获动态纹理内在的动态特性。此种识别技术能够识别同一图像序列中,在各个不同区域的多个不同的动态纹理。且相对与基于距离的识别技术来说,计算更简便,识别速度更快。因此,基于此算法,本文提出了一种基于多子空间动态纹理模型的改进算法。由于多字空间模型能更好地捕获复杂的景象变化,改进的算法识别动态纹理的非稳态特性效果也更好。改进的算法利用所有的脉冲响应序列构建一个全体特征空间,并将其映射为此空间上的一组抛物线。此特征空间为比较不同脉冲响应序列的最佳空间。此外,改进的算法还采用了一种简单、有效的对分检索(binarysearch)算法在高维特征空间寻找最近邻,使识别过程更有效。实验表明,本文提出的改进算法,其性能比原算法更好。