论文部分内容阅读
近些年来,随着各类传感技术逐渐成熟,人机交互技术的研究也获得突破性发展。在过去的几年中,如何使用廉价的设备来捕获人体运动成为了一个越来越热门的研究课题。
基于计算机视觉的人体运动捕捉一直就是研究的热点。传统的做法采用的是带标志点的识别方式,通过对标志点进行匹配和三维重建,获取目标的三维信息。微软最新发布的Kinect系统中,采用了无标志点的人体运动捕捉技术,用户不需要佩戴任何辅助道具,即可以实现目标三维点云的获取,进而可以实现人机的交互。
本文主要研究基于计算机视觉的运动捕捉和三维测量系统中的核心的问题--多目标匹配算法。
我们的起点是传统的带标志点的方式,在人身上佩戴反光材料,通过一个可见光摄像头和一个红外摄像头,分别获取左右图像的目标点,然后利用时空张量的多目标匹配算法完成匹配,重建出三维位置。带标志点的方式,快速、稳定、精确,但是限制了用户的自由运动,随着人机交互技术的不断进步,逐渐淡出主流的地位。
无标志点的人机交互方式彻底解放了用户的身体,带来了全新的技术变革,因此我们的重点放在了这上面。无标志点的三维感知测距技术主要分为被动和主动两大类,前者中目标的照明是由物体周围的光线来提供,后者则使用一个主动的光源装置来提供目标物体周围的照明。相应的,我们采用的算法有主动式的激光器辅助测量的方法,以及被动式的可见光图像匹配方法,具体来说,后者又包含局部的RIFF特征描述算法和全局的BP(置信传播)算法。
最终,通过实验比较,我们选取最优秀的快速BP算法,结合激光点阵,实现了一个无标志点的三维重建系统,完成了对目标场景的三维点云获取。