论文部分内容阅读
人眼与大脑的协作使得人们可以获取、处理及理解视觉信息。人类利用视觉感知外界环境信息的效率很高,事实上人类获取的环境信息中有80%左右是通过视觉得到的。近年来,随着计算机技术和数字信号处理技术的迅猛发展,人们学会了用摄像机获取环境图像并将其转换成数字信号,且利用计算机实现对视觉信息的处理。一般来说计算机视觉就是用计算机实现人的视觉功能——对客观世界的三维场景的感知、识别和理解,这意味着计算机视觉技术的研究目标是使计算机具有通过二维图像认知三维环境信息的能力。三维重建指的是利用图像或其它信息和手段定量研究实物或场景中三维环境信息的技术。目前,三维重建问题的研究成果应用面很广,主要包括医学成像、建筑学、动画模拟、动作识别和机器人导航等领域。所以说它是近年来计算机视觉研究中,备受关注的一个课题。本文先从计算机视觉基本理论入手,进而引出三维重建这个研究课题。三维重建主要包括摄像机标定、立体匹配、三维重建三个重要组成部分。摄像机标定主要是为了得到所用的拍摄图片摄像机的内外参数,为确定摄像机的投影矩阵做好准备。本文采用线性和非线性相结合的标定方法并在Matlab环境下完成,所使用的为Jean-Yves Bouguet的Matlab摄像机标定工具箱。立体匹配是进行三维重建中最关键的一步,也是本文的重点研究对象。结合实际情况我们采用了基于窗口的稀疏点匹配算法,该算法主要是对图像中的一些强特征点进行匹配,比如角点、轮廓点等。匹配完了再对这些点进行插值运算,以得到较完整的匹配结果。最后在图像修正后进行三维重建,主要研究的方法是通过摄像机的成像模型来求出三维点的坐标。在实验论证阶段,本文利用VC++及Inter公司提供的专门用于计算机视觉开发的OpenCV库,实现了对拍摄的实际物体的三维重建,验证了本文所叙述理论的可行性。