论文部分内容阅读
基于视觉人体运动分析,是指如何从变化的场景中不同时刻的图像里提取出人体的位置、运动、姿态等信息,它在姿态识别、语义分析、行为理解、虚拟现实、智能监控、人机交互、运动分析等方面具有广泛的应用前景和潜在的经济价值。近年来,人体运动的视觉分析受到国内外学术界和企业界的广泛关注,发展至今已有两大类常用的研究方法,一类是基于模型的人体运动分析,一类是基于学习的人体运动分析。但作为计算机视觉领域中的一个热点和难点,该研究仍然有很多理论与技术问题需待解决。在基于模型的人体运动分析方法中,还没有一种方法能够描述模型投影与图像特征的解析关系;在人体运动的估计和跟踪中,初始帧的初始点都需要手工标记;跟踪过程中,运动模型比较单一;在基于学习的人体运动中,适合于人体运动的机器学习亟需发展研究。根据目前基于视觉的人体运动分析的研究现状和特点,本论文对图像的特征提取、表达、卷积曲面三维重建、确定性优化算法、滤波跟踪算法、机器学习理论等进行了深入的研究和探索,在人体建模、初始化、运动跟踪、以及机器学习等方面开展了创新性的工作,主要体现在以下几方面:1.提出卷积曲面与卷积曲线在正交投影和弱透视投影下的对应定理,将卷积曲面引入人体运动分析。针对以往的研究中人体模型投影与图像特征缺乏解析关系这一缺点,提出卷积曲面与卷积曲线在正交投影和弱透视投影下的对应定理,将卷积曲面引入人体运动建模,通过某种函数沿着连接刚体进行积分得到表达人体模型的卷积曲面,然后用卷积曲线对图像轮廓进行建模,通过卷积曲线对图像轮廓线的拟合求得人体运动参数。2.提出了一种人体关节点的自动定位的方法。针对以往工作中初始关键点需要手工标记的缺点,提出了一种人体关节点的自动初始化方法,通过图像中人体区域的自身特点,自动的找到头顶点,中心点以及四肢点的初始位置,在关键点自动定位的基础上,给出漏检点预测机制;并构造出三维骨架与图像人体区域骨骼线的相似度,最后通过确定性优化算法恢复三维运动。3.给出一个两层的滤波框架,将交互式多模型(IMM)引入长序列图像的三维人体运动跟踪中。针对在单一模型下人体运动跟踪效果不好的缺点,将交户式多模型(IMM)引入三维人体运动跟踪中,同时从三维人体运动的真实数据中学习到各关节的运动约束,以及用岭回归方法训练出不同动作的多个运动模型,最后利用交互式多模型框架来解决人体运动跟踪问题。4.提出共享动态隐变量模型并将其应用于人体运动跟踪。为了将状态跟踪局限在低维空间内进行,推导出共享动态隐变量模型,求出观测向量与状态向量的低维共享动态隐变量,通过离线的训练得状态方程、观测方程与重建方程,然后使用在线的粒子滤波器进行低维的隐变量跟踪,最后实现高维的重建。5.从理论上探讨了共享隐结构模型的实质,并证明其与经典主分量分析的等价性。针对经典的共享隐结构算法需要使用确定性优化算法或者EM算法求解,初值的设定以及优化速度精度,很难控制这一特点,给出共享隐变量模型的解析式,证明了高斯过程共享隐变量模型等价于经典主分量分析方法,即可以用主分量分析方法作为共享隐变量模型的解析式。