论文部分内容阅读
近年来,增强现实、机器人导航和同时定位与地图构建等技术引起了学术界和工业界的广泛关注,其中基于影像的定姿定位技术是一项关键任务。相机姿态估计是根据从3D场景中获取的影像推断出相机的空间位置和朝向。本文介绍了相机姿态估计的基本理论和相关技术,提出了一种基于四元数表示旋转的恢复相机姿态的方法,同时结合三维建模技术,将高精度的3D模型作为参考,实现单张影像的姿态确定,并通过用四元数表示旋转,采用扩展卡尔曼滤波求解n点透视问题。本文利用四元数表示旋转,从捕获的影像中推断出运动相机的相对旋转和平移。采用SIFT算法提取图像的特征点并完成特征匹配,使用随机抽样一致性函数(RANSAC)算法剔除误匹配,将正确匹配的特征点对从像素坐标系转化到欧式坐标系,构建多项式方程组。先求解出相机的相对旋转,再将求解出的旋转代入方程式,恢复出平移向量,最后利用两帧间的深度值确定唯一解。实验采用公开的无人驾驶与机器人定位数据集,对该方法进行性能分析,将估计的姿态值与真实姿态值进行比较。与经典影像定位的算法对比,该算法可以较好地估计出运动相机的姿态并具有良好的鲁棒性。针对单张影像姿态估计精度不高的问题,利用三维重建技术建立高精度3D模型作为参考,校准该区域单张影像的外方位元素。首先,通过对不同视角获取的多张无序影像实现3D建模,在此基础上使用虚拟标校相机将高精度3D数字表面模型投影到图像空间上,并将该影像当作参考影像。然后,将待查询的影像与该参考影像进行匹配,该过程包括两个步骤:1)特征提取;2)相似性度量和特征匹配。最后,使用四元数表示旋转,并根据参考影像与待查询影像间的特征点对应关系求解出相对旋转,再结合初始投影信息确定出待查询影像的姿态。基于实际应用中相机跟踪的特征点易于漂移的特性,同时,鉴于相机姿态的时间依赖性和连续运动相机姿态估计的特征不确定性问题,本文采用扩展卡尔曼滤波器(EKF)跟踪序列影像中的3D对象,并估计出相机相对于场景的位置和方向。该方法从相机的运动模型中计算相机姿态的先验估计,然后通过最小化参考点的重投影误差来校正。有效地克服了随时间推移特征点的特征的不确定性。仿真实验结果表明,该方法在存在噪声的情况下改善了相机姿态估计的鲁棒性。