论文部分内容阅读
目标识别和定位是增强现实(Augmented Reality,AR)中的重要环节,可实现空间目标的识别和相机相对于目标的位姿估计。在增强现实系统中,通过将计算机产生的虚拟物体或信息与真实场景叠加在一起,为实现融合效果的感官真实性,首先识别待“增强”的目标真实场景,并保证虚拟对象和现实场景的匹配精度和动态一致性,这就需要实时跟踪现实世界中相机的位姿。由于现实环境比较复杂,在目标识别及相机位姿估计过程中,首先需要解决的问题是提取高效稳定的特征匹配点对,利用匹配结果识别相同或相近物体,估计相邻视图之间的变换矩阵,进而得到相机在不同位置的外部参数矩阵。可见,特征的匹配精度及匹配效率直接影响目标识别和定位方法的准确性及实时性,特征匹配已成为目标识别和定位的关键技术。目前,常用的特征描述及匹配方法主要可分为两类:基于不变量的局部描述算子的特征识别及匹配和基于统计学习方法的特征识别及匹配方法。然而,特征匹配及相机位姿估计存在以下三方面问题:(1)局部不变性特征采用高强度的特征描述以提高其对环境的适应性,不仅包含关键点自身的信息,还联合关键点周围对其有贡献的像素构建出高维的特征向量描述子,维数越高,鲁棒性越好,但计算复杂度越高。SIFT算子是128维的特征向量,SURF算子是64维向量,显然,较高的维度使这类算子的提取及匹配过程计算量负担大、运算速度慢,且需占用大量的内存空间。当环境中有数千上万个特征时,局部特征将无法满足实时系统的要求,且对于实时AR系统在移动终端上的应用扩展非常不利。(2)基于统计学习方法的特征识别及匹配方法把计算量转移到离线分类器的训练,在线特征匹配具有计算量小的优势,但该类算法特征识别及匹配效果受分类器性能影响,随机性较强,稳定性较差。随机蕨(Random Ferns)[1][2][3]方法由V.Lepetit等人在2009年提出,采用朴素贝叶斯分类模型,是迄今效果最好的机器学习特征匹配方法,但也存在匹配精度不足的问题。由于朴素贝叶斯分类模型本身的特性,需假设各特征属性之间相互独立,并对特征属性进行随机分组。然而,由于特征属性由灰度比较得到,图像的像素之间又必然存在联系,随机分组忽略了不同属性组合对分类器的重要性不同。而不恰当的属性划分会影响分类器的质量,并最终导致分类结果随机性较强,匹配率较低。(3)在相机内部参数已知情况下,已知空间目标点与其像点的匹配对应关系,可求解相机相对位姿,也被称为PnP(Perspective-n-Point)(?)司题。现有的PnP算法大致可分为迭代算法和非迭代算法两类。非迭代算法采用代数方法直接求出相对位姿,该类算法具有运算量小、计算速度快等优点,但受误差影响大,且精度不高,常应用于迭代算法的初值计算。迭代算法是将PnP问题表示为受约束的非线性优化问题,通过求解该优化问题得到相机相对位姿的数值解。该类方法精度较高,但计算量较大,且受初始值的影响算法通常会收敛到局部最小值而不是全局最小值,或收敛到错误解。因此寻求一种折中的PnP问题解决方法,对于实现快速准确的目标定位非常关键。针对以上问题,目前目标识别和定位的研究目的可总结为:一是简化局部不变性特征提取,并采用有效的数据结构及搜索查询算法,提高特征匹配的速度;二是发展完善基于统计学习的特征匹配方法,降低时间复杂度,并提供有意义的信息指导属性组合划分,降低盲目性,不断提高特征识别率和匹配精度;三是设计精度较高,且计算量较小的相机位姿确定方法,并尽量减少初始值对估测结果的影响。本文以目标识别和定位为研究对象,重点系统研究了特征匹配技术及相机位姿估计方法,本文主要工作如下:(1)局部不变性特征的快速匹配方法由于局部不变性特征匹配的高强度描述特性,为降低高维矩阵匹配的计算量,并减少对内存的消耗。多维二进制索引树(Kd-树)是把二叉树推广到多维数据的一种主主存数据结构,本文采用扩展Kd-树建立多维索引,并利用最近邻查询算法在Kd-树中检索与查询点距离最近的数据点,即待匹配点。Kd-树的引入极大方便高维特征点的搜索操作,但查询得到的结果并不一定是正确的匹配对,本文采用随机抽样一致性(RANSAC)提纯匹配点对,给定合适的迭代参数,RANSAC可得到较好的拟合结果。图像拼接的应用实例验证了特征匹配的有效性。(2)基于条件互信息量的随机蕨特征匹配方法本文重点研究随机蕨算法,利用条件互信息量[4][5指导特征属性的组合划分,提出了一种基于条件互信息量的随机蕨特征匹配方法,以MI-Ferns表示,其主要内容包括:训练样本获取,特征属性划分,离线分类器训练及在线特征识别及匹配。其中,最关键的部分是分类器的离线训练阶段,训练的结果直接影响在线特征匹配效果。本文提出的MI-Ferns方法改善了随机蕨蕨丛构建的盲目性对分类结果的影响,提高了离线分类器的分类性能。另外,由于特征属性间的条件互信息量计算仅存在于离线阶段,因此不会增加在线匹配的运算时间。仍利用RANSAC方法剔除误匹配点,进一步提高匹配精度。通过实验对比原有随机蕨算法(RF)与改进随机蕨方法(MI-Ferns)的特征识别率和匹配性能,验证了改进随机蕨方法的有效性及较高的匹配精度。(3)相机位姿估计方法研究相机位姿估计有多种方法,从课题实际需求出发,本文设计了一种计算量较小,受环境噪声影响小的相机位姿确定系统。该系统中,由改进的随机蕨算法提供特征匹配对,相机模型采用小孔成像模型,并根据张氏标定算法求取摄像机的内部参数矩阵,采用一种非迭代的PnP方法[6]估计相机的投影矩阵。该方法将空间坐标点和图像特征点均表示为4个虚拟控制点,把PnP问题转化为估计4个虚拟控制点在相机坐标系中的坐标值问题。该方法计算简单,但精度与迭代方法相比仍然较低。因此本文采用高斯-牛顿非线性算法对求解结果进行优化,非迭代算法求取的结果作为优化的初始值,使得该方法的计算精度可达到Lu于2000年提出的最经典的迭代方法[7]的精度,且优化算法的引入没有明显增加计算量。实验结果表明,基于不变量的局部特征匹配技术,对光照、尺度、遮挡等条件下具有一定的适应能力,改进的随机蕨算法识别率较好,其匹配结果经RANSAC算法拟合得到的单应性矩阵,对目标在图像中的定位具有一定的可靠性。非迭代的PnP算法可准确估计出相机位姿,在相机运动过程中,通过图像间的视图约束关系,推导求出不同位置的投影矩阵,为增强现实中虚拟物体的叠加提供准确的配准定位信息。