论文部分内容阅读
图像处理和人工智能的发展,使得人体运动分析和理解技术在近年来有了很大的进步,并在多个领域得到了应用。而实现人体运动分析和理解的前提是能够捕获人体的动作。在传统的方法中,存在着诸多问题,例如不能自动地初始化,不能在跟踪运动失败时自恢复,不能解决遮挡问题,或者对参与者有诸多约束,等等。如果能从单张图像中确定人体关节点的准确位置,就能有效地解决初始化和自恢复的问题。同时,由于人眼能从图像中获取丰富的信息,有理由相信计算机也能够从图像中解决遮挡问题。从图像中获取人体的关节点,主要有两个阶段:人体与背景的分割,人体关节点的定位。微软的深度相机Kinect,能够将物体到相机的距离信息体现到图像上,提供了一种很好的分割人体和背景的方法。同时,深度图也能体现出人体在运动时的遮挡部分的信息。利用挡在身体前方的手臂会引起身体区域内深度值突然变小的信息,可以识别手臂的位置。使用深度图像还有不用限定人的衣着,环境光照条件,等等优势。此外,人体的结构和动作,都可以用骨架很直观地表示出来。经过数学形态学的方法处理,可以比较准确地提取人体的骨架,减少图像边界和内部噪声的影响。利用好Kinect提供的深度信息,可以解决部分遮挡的骨架提取问题。之后,在每个骨架线上定位出弯曲最大的点,也即是关节点,就能获取完整的人体动作状态参数。从单幅深度图中定位人体的关节点,最佳的用途在于解决运动跟踪时的初始时刻定位和跟踪失败时的自动恢复。