论文部分内容阅读
人体动作识别已经成为计算机视觉研究方向的一个前沿领域,其应用范围主要包括视觉监控、运动分析、人机交互、虚拟现实等。人体动作识别研究中,往往是对视频或序列图像进行运动分析,所要处理的动作特征维数一般较高,导致运算和存储相应的时间复杂度和空间复杂度较高,难以从中提取出表现其真实内在结构的内蕴特征。流形学习是近来机器视觉与模式识别领域中一种热门的非线性降维方法,其主要目的是通过寻找高维空间到低维流形的非线性映射,从而获得隐藏在高维空间中的有效数据信息。本文主要研究如何将流形学习与人体动作识别进行更好的结合,包括动作识别中特征的提取与表示,以及高维特征向量的维数约简等。本文主要贡献为:1.对有监督等距映射算法进行了改进,针对其无法给出显式映射在分类识别应用中的局限性,本文假定局部邻域内线性表出关系映射至低维流形空间保持不变,通过最小化线性表出误差求解新样本在原高维数据集中的近邻表出,同时根据局部流形的弯曲程度重构邻域,提出一种动态邻域增量式有监督等距映射算法,该算法最高识别率达到98.97%。2.与有监督等距映射算法利用类别信息构建差异度度量矩阵不同,此处从另一种思路出发,在近邻图构建时,引入自适应权重近邻点距离因子,利用样本类别信息,对近邻点距离进行重构,计算目标点与局部邻域内每一类别样本点的平均距离,改进目标点到该类别各点的距离度量。同时为提高增量学习速率,引入推广的等距映射算法,该算法最高识别率达到95.41%,识别单个序列仅需0.0357s。3.传统流形学习在动作识别中对图像进行单方向向量化,丢失了图像的空间信息,本文提出距离变换结合局部最大异类嵌入的算法,使用像素点到最近目标点距离代替像素值对该点进行描述,降维时在邻域内使得异类样本彼此远离,通过均值Hausdorff距离求取序列间的差异度。该算法在Weizmann数据库和KTH数据库上识别率分别可以达到100%和94.5%。