论文部分内容阅读
人体检测与运动恢复是当前人工智能和计算机视觉领域研究的热点,已广泛应用于车载辅助系统、智能监控系统、人机交互以及体育运动训练等领域。对人体检测问题的有效解决能够为其他对象检测提供借鉴。直接从图像或视频中获取人体运动数据,不仅降低动作获取成本,同时,也使用户可以从大量的视频源中挖掘更多的潜在信息。基于单目视觉的人体检测与运动恢复技术主要面临以下三个难点:1)人体数据中噪声所占比例大,每帧中待检测窗口数量大,且人体所占比例极少;2)人体数据及动作具有非常大的类内散度,包括人体形态上的差异与动作差异;3)人体运动目标从三维投影到二维会造成深度信息丢失,且检测结果容易受复杂背景、遮挡、光照和外观变化影响。本文围绕基于单目视觉的人体检测、骨架抽取与运动恢复这一主线,借鉴当前一些特征抽取、机器学习、运动恢复的主流技术,提出了若干改进方法,论文的主要工作如下:(1)提出一种混合特征的人体特征描述子及快速的人体检测器。在面对复杂背景,光照及外观变化较大的场景时,单特征描述的人体检测器描述能力有限,难以满足高检率、低误报率的要求。本文通过融合图像梯度方向直方图特征与Census变换特征来提高分类器的鲁棒性。基于Adaboost学习的分类器训练过程较慢,针对此问题,通过快速特征选择、双阈值判决两方面的改进,提高了分类器的训练时间。在检测速度上,从分类器设计及目标窗口特征计算两方面做了改进。利用Cascade结构构造分类器,采用逐级排除非人体目标的策略,提高分类器检测速度。提出基于“块”更新的目标扫描策略,当检测窗口在待检测图像上滑动扫描时,只对窗口变化区域的“块”重新提取特征,计算其直方图分布来加速检测过程。实验结果表明,改进后的基于混合特征的级联AdaBoost人体检测器,可以检测静态图像中各种分辨率下的人体目标。与单特征的人体检测方法相比,在公开数据集上验证了本文方法在检测性能与检测速度上均有所提高。(2)提出一种基于多示例学习的多部位人体检测方法。由于整体滑动窗口检测方法忽略了人体的非刚性,其特征描述是建立在一个矩形窗口上。所以在处理多姿势、部分遮挡、视角变化等人体目标时鲁棒性不高。本文对基于部位的人体检测算法进行改进,根据生理结构将图像分割成若干区域,每个区域包含多个示例,利用AdaBoost多示例学习算法来训练部位检测器。然后利用各部位检测器对训练样本进行测试得到其响应值,从而将训练样本转化为部位响应值组成的低维特征向量。再用SVM方法对这些样本部位向量进行学习,最终形成部位组合分类器。在INRIA数据集上的实验结果表明,算法能改进单示例学习的检测性能,能检测出部分被遮挡的人体目标。同时评价了3种不同部位划分及其对检测性能的影响。(3)提出基于单目视觉的无标记、无初始化的人体运动恢复方法。在现有的无标记单目视频运动恢复方法中,需要在初始帧进行手工初始化。很多基于概率模型或基于学习的方法,存在着计算复杂度过高或依赖样例库等问题。本文的运动恢复工作包括直接从图像信息中抽取骨架,估计关节点初始二维坐标,并进一步恢复人体三维坐标等操作。首先,利用图像梯度变换方法从单目视频图像中自动抽取人体的线形骨架,并利用人体生理特征骨骼比例关系对骨架的主要关节点位置进行估计,从而在初始帧避免人工初始化。在比例正交投影的假设下对三维人体运动信息进行恢复,通过计算适用于人体比例因子来对每段骨骼进行恢复,利用卡尔曼滤波对每段骨骼运动进行跟踪。本方法无需对摄像机进行标定,无需专门辅助设备,对数据环境也无特殊要求。