论文部分内容阅读
人体运动跟踪是计算机视觉领域的重要分支,已经在医疗应用、无人驾驶、人机交互等方面得到了广泛应用,但是图像观测空间数据维数庞大、图像特征表示模糊、自遮挡和运动多变性等仍是需要解决的难点问题。本论文主要研究视频图像序列的人体运动跟踪,汲取基于机器学习方法的优势,分析人体运动跟踪的各个阶段的特性,通过结合对视频图像中人体特征的提取和对回归方法的改进,解决了在人体运动跟踪中存在的运动观测数据庞大,图像特征提取合理化等具有挑战性的问题。本论文主要完成了下列工作:1.改进随机高斯隐变量模型并将其用于人体运动跟踪。1)在隐变量的初始化阶段,使用K-means算法对随机产生的隐变量进行聚类,选取聚类中心作为初始的参考点,并在隐变量选取该该点的近邻点作为计算梯度的元素,2)在选取参考点以后,LPP(Locality PreservingProjection)将原有的三维隐变量投影到二维,在其中选取参考点的近邻点。改进的算法在初始点的选取和计算复杂度上取得较大改进,使跟踪结果具有较大的鲁棒性和准确性。2.提出了一种使用Bandelet2人体图像特征结合极速学习机(ELM)的人体运动跟踪方法。第二代条带波特征表示方法能够通过几何流准确表示图像的人体结构信息,根据几何流的图像描述可以避免传统的基于边缘的,或基于轮廓的图像表示方法产生的表述模糊性极速学习机只需要设置网络的隐层节点个数,在算法执行过程中不需要调整网络的输入权值以及隐元的偏置,并且产生唯一的最优解,因此具有学习速度快且泛化性能好的优点;改进的核极速学习机将极速学习机的应用范围扩大,在特征映射未知的情况下,定义一个核矩阵用于极速学习机,同样对于人体姿态的回归有良好的效果。3.提出了一种基于RGB-D图像特征的人体运动跟踪方法。1)提取图像的核描述子并使用高效匹配核(EMK)对提取的核描述子进行分析;2)使用块匹配方法提取视频图像相邻帧间的像素位移作为视频图像的深度信息:3)将深度信息作为额外的通道结合核描述子用于运动跟踪,实现三维运动姿态恢复。