论文部分内容阅读
双目立体视觉是计算机视觉领域的一个重点热点研究问题,它由左右两台摄像机拍摄同一场景,通过计算空间点在左右图像中成像点的位置视差,然后结合摄像机标定参数和三角视差原理,从而获取空间点的三维坐标值。双目立体视觉模拟人类视觉处理场景、感知外部世界,具有重要的理论研究价值和实际应用价值,国内外科学研究者对相关问题进行了大量研究,但是由于问题本身的复杂性,双目立体视觉在生产生活实际中的应用研究还处于初级阶段。本研究课题立足于双目立体视觉的实际应用,尤其是针对一般条件下快速视觉导航应用进行了关键技术研究。论文围绕双目立体视觉系统的立体匹配、对象分割以及对象三维重建等重点难点问题展开研究,主要工作涉及以下三个方面。(1)立体匹配是双目立体视觉的核心研究内容,它是实现二维媒体到三维媒体转变的关键技术。论文针对目前快速立体匹配算法中基于插值局部立体匹配方法在物体边界等视差不连续区域以及初始异常匹配点形成区域视差计算不准确的问题,提出了一种基于扩展三角插值的局部立体匹配算法。该算法探讨了三角插值视差面的可靠性以及如何量化其可靠性的方法。根据三角视差面的可靠性和视差局部平滑性,建立了一个基于贝叶斯先验的立体匹配模型。实验结果表明本文算法能够解决物体边界视差不连续区域视差计算不准确的问题,而且时间效率较高,能够满足一般条件视觉导航深度获取的应用需求。(2)双目对象分割是双目图像内容分析和场景识别的基础。对象分割是图像处理领域的基本问题也是难点问题,本文针对传统二维图像分割算法主要依赖图像基本信息(灰度、RGB、边缘纹理)进行分割的局限性,提出了利用双目图像立体匹配得到的视差信息进行多对象分割的算法。实验结果表明,本文双目图像对象分割算法在分割效果上比传统的二维图像分割算法更理想,分割对象更具语义特性,而且算法效率高,处理一幅图片在毫秒级,满足视觉导航快速对象分割提取的需求。(3)对象三维重建主要是为了得到对象的三维形态和空间位置,关键技术在于获取对象完整的3D点云。针对不同视角对象配准,本论文实现了两种方法:局部关键点对象匹配和全局对象区域匹配。实现对象配准后,将不同视点下的配准对象通过对象仿射变换融合到参考视点,从而得到参考视点下对象完整的三维点云。最后再利用OpenG L实现对象三维点云的立体显示。针对双目立体视觉在视觉导航中的相关技术,本文最后实现了一个基于MFC的原型系统。双目立体视觉的关键技术是深度感知和三维重建,论文针对视觉导航应用中场景内容分析识别的关键技术展开研究,具体包括立体匹配、对象分割及对象重建,针对每个子问题分别提出了自己的解决方案,相关实验结论表明,本文研究内容具有一定的实际可用性。