论文部分内容阅读
计算机立体视觉经过几十年的发展,目前已经成为计算机科学的重要研究领域之一。双目立体视觉作为计算机视觉中的一个重要分支,一直是计算机视觉研究的重点和热点。双目立体视觉直接模拟人类视觉处理景物的方式,可以灵活地测量景物的立体信息,并且在由二维图像获得图像深度信息上具有很大的优越性,对它的研究无论是在视觉生理上还是在具体的工程应用中,都具有十分重要的意义。
本文的研究思路以Marr的计算机视觉理论为基础,研究了双目立体视觉的功能模块实现过程,即3D场景、成像模型、成像变换、摄像机标定、图像特征选取、图像特征匹配、三维重建,通过Intel公司开发的开源项目OpenCV库和IPL库,利用VC++6.0编程实现了模块中的功能。
本文的图像采集采用的成像模型是带畸变的小孔成像模型,成像变换主要有:世界坐标系到摄像机坐标系的变换,摄像机坐标系到成像平面坐标系的变换,成像平面坐标系到计算机数字图像坐标系的变换。
在进行摄像机标定时,本文采用的是传统的基于径向排列约束(RAC)的两步法。这种摄像机标定方法主要考虑是在带畸变的小孔成像模型下,按照径向畸变的约束条件,通过计算无畸变的初始值和迭代,求解得到摄像机的内部参数。
在选取图像特征时,本文选取Harris角点作为图像的特征,首先对获得的角点进行初始的基于灰度的相关匹配,得到可能的角点匹配集,然后计算匹配点的外极线几何和基础矩阵,通过8点算法、RANSAC算法和LMEDS算法,进一步筛选剔除错误的或歧义的匹配点,得到较为鲁棒的匹配点,然后利用鲁棒的匹配点计算更为精确的外极线几何和基础矩阵,再通过LMEDS算法和外极线算法提取出新的匹配点,组成最终鲁棒的匹配点集,用于场景的三维信息恢复。
根据获得的匹配点和计算得到的基础矩阵以及摄像机内参数矩阵,本文计算得到本质矩阵,并进一步获得了摄像机的外部参数矩阵。这样,通过摄像机的外参数矩阵和求得的匹配点,计算匹配点的三维坐标值,继而得到场景中物体的深度信息(距离信息),最后通过对离散的三维坐标点的插值,重建三维场景并显示。