论文部分内容阅读
基于视频的人体姿态跟踪和三维姿态估计在人体动画、游戏、人机交互、视觉监控、体育运动分析、医疗诊断、虚拟现实和增强现实等领域均有着广阔的应用前景。传统的方法中,需要在人体上安装标记点以实现对人体精确的姿态跟踪,但此类系统通常都非常昂贵,而且添加的标记点一定程度上影响了人体的运动,极大地限制了该系统的应用。如智能监控、人机接口(HCI)、医疗诊断、体育运动分析等应用都需要利用无标记点的人体运动跟踪方法。基于视频的无标记点人体运动捕捉系统就是为了这一目标而提出的,并且经过二十余年的发展,逐渐成为一个热门的研究领域。本文着眼于单目视频中无标记点的人体姿态跟踪和三维姿态估计展开研究工作,主要贡献包括以下三个方面:首先,在目标跟踪领域,常常通过建立先验模型,如路径一致性假设模型,对目标轨迹进行预测来处理跟踪过程中的遮挡问题。然而,当这种预测与目标的实际运动轨迹相差较大的时候就会发生跟踪失败。针对这一问题,本文提出了一种交互式粒子滤波方法,通过判断不同目标样本观测之间的遮挡关系,自适应地选择不同外观模板进行相似性度量以更新粒子权值,成功地解决了跟踪过程中各目标之间的相互遮挡问题。人体四肢可以看做铰链连接的多个目标进行跟踪,因此可以利用交互式粒子滤波算法思想解决肢体之间的遮挡问题,实现对肢体的稳定的二维跟踪。其次,提出一种适用于三维人体运动跟踪和姿态估计的具有肢体长度约束信息的人体图模型,并将该模型与一个用于获取肢体观测的二维外观纸板人体模型和一个用于三维人体姿态估计的三维火柴棍人体模型进行了有机地结合。作者针对分块采样粒子滤波算法提出人体图模型。在该模型中,图的节点与关节点相对应,而边与肢体观测和肢体长度约束相对应,能够更好地将约束信息融合到人体姿态跟踪的概率框架内。同时,该人体图模型与二维纸板模型和三维火柴棍人体模型有着相同的关节结构,便于二维和三维关节点坐标序列的计算。最后,粒子滤波算法虽然提供了一种在一组非高斯、非线性且多模的观测数据中估计后验概率的有效方法。但由于人体姿态跟踪的高维特性,在使用粒子滤波解决这一问题时通常需要大量的粒子,使粒子滤波算法运行缓慢甚至失效。本文引入分块采样粒子滤波算法(Partitioned Sampling Particle Filtering),在此框架下使用颜色、边缘和运动特征相融合构造粒子权值度量函数。同时,在所提出的人体图模型上使用一种改进的信任度传播(Belief Propagation)算法进行权值的传播,使得在一个关节点上能够同时应用多个人体约束。结合交互式粒子滤波算法,实现了对肢体的稳定的二维跟踪。在捕获人体关节点二维图像坐标后,根据摄像机成像模型计算出各关节点的相对三维坐标,进而估算出人体相对图像坐标系的三维姿态。本文的研究工作为多目标跟踪领域提供了一种处理目标间遮挡问题的方法,并将该方法应用到二维铰链人体姿态跟踪领域,较好地处理了肢体间的自遮挡问题。同时,通过引入分块采样粒子滤波算法并在一个人体图模型上应用肢体长度约束,实现了较为精确的二维人体姿态跟踪。最后,通过采用比例正交投影模型计算关节点相对三维坐标,实现了三维人体姿态的估计。实验表明,本文方法具有较高的精度和较强的鲁棒性。