论文部分内容阅读
立体视觉技术是计算机视觉领域中一个非常活跃的研究热点,它结合了图像处理、计算机视觉、计算图形学以及生物生理学等诸多领域的理论和方法。它通过对多张图像的分析处理来获取物体的三维几何信息,尽可能逼真地实现模仿人类的双目视觉的功能。立体视觉是指从两个不同的角度去观察场景中的同一个物体,来获取不同视角下的二维图像,再运用成像几何原理来计算图像像素之间存在的位置偏差(视差),从而获取物体的三维信息。如今,三维重构技术已经广泛应用于工业检测、三维测量、虚拟现实以及化学、地质学和物理学等领域,可见,该课题的研究能够解决许多实质性的问题。因此,对它进行更深入的研究,将会有非常重要的意义。立体视觉技术的实现由图像获取、图像预处理、摄像机标定、立体匹配和三维重构几个步骤完成。本文的主要研究工作如下:(1)首先通过摄像机获取不同的视点下的两张图像,然后将彩色图像灰度化,对图像进行灰度变换、中值滤波和边缘检测等处理,并有效的去除图像噪声,增强图像的边缘和细节。(2)摄像机标定采用BP神经网络,通过自适应调整学习率的动量算法进行训练,避免了标准BP算法陷入局部极值的缺点,得到摄像机的内外部参数,并且它不需要好的初始条件,没有非常复杂的计算过程,通过训练可以满足旋转矩阵的正交性。它的优越性通过对添加噪声的合成数据的仿真得到验证,具有较强的实用性、鲁棒性和较高的标定精度。(3)立体匹配是立体视觉中最重要也是最难的一个步骤,首先通过Sobel算子提取左右两张图像中的对应边缘点,然后建立匹配目标函数,本文通过人工鱼群算法对目标函数进行寻优,避免陷入局部极值点,达到全局最优,实验结果表明这种方法可以较好地实现立体匹配,从而提高了匹配精度。(4)最后依据上面几个步骤得到的结果,根据立体视觉的基本原理,计算出物体的三维坐标,通过得到的视差,用基于三角测量的方法来恢复深度信息,从而生成3D环境的深度图。