论文部分内容阅读
在机器视觉领域中,关于“人体运动”的研究一直在不断地进行着,从最初的人体检测和定位、人体运动跟踪,到现在的人体姿态识别、人体动作识别,甚至行为理解。研究起初,研究人员对普通二维图像包括灰度和彩色图像做了大量的研究,尽管设计出各种先进的图像处理算法,但是仍无法避免一些噪音问题,如光照、颜色、纹理、遮挡等。在硬件技术和学术理论的推动下,学者们的目光不在局限于普通图像,而是寻找新的图像表达方式,如X光图像,红外线图像,希望从这些图像中挖掘出普通图像所没有的数据。近几年来,深度图像也走进了研究人员的视野,图像中的每个像素表示场景中的某一个点到摄像机的距离,换句话说,深度图像可以直接从三维空间获得场景的三维数据,相比利用普通图像进行三维重建,它帮助研究人员快速而方便地走进三维世界。实际上,深度图像也属于计算机视觉的研究范畴,只不过数据的表达方式不同,因此很多现有的图像处理算法是可以借鉴和扩展的。本文在深度图像的基础上,对人体运动特征模型和识别算法进行了研究,为动作识别研究提供了一种新的思路和方法。本文主要工作如下:(1)对人体动作识别的背景及意义,研究现状进行了概括,分析了目前动作识别所面临的问题,分析了深度图像应用于动作识别的可行性,为本文的研究提供了基本思路。(2)本文采用微软Kinect体感摄像头获取深度图像,并结合其SDK得到了20个三维人体骨架关节点。在此基础上,分析了人体关节的运动特性,提出了一种关节角度变化序列的运动特征模型。该模型复杂度低,计算简单,具有组合性。(3)对现在主流的识别算法进行了介绍。在设计分类器方面,本文并没有单纯得套用复杂先进的识别算法,而是在详细分析运动模型的特点之后,决定采用动态时间规整算法(DTW)。然而,传统的DTW算法并不能总是得到满意的匹配效果,因此本文也针对其缺点提出了一种改进算法,大大提高了匹配的准确性。(4)针对模板匹配所耗费的时间代价,本文采用并行计算提高计算速度,并结合大量的实验分析,展示了本文动作识别算法的有效性和鲁棒性。论文最后总结全文的研究工作,并对下一步的目标和研究方向进行了讨论和展望。