论文部分内容阅读
利用双目立体视觉进行场景三维重建是计算机视觉的一个热门研究领域。其主要包含标定、匹配、重建三个环节,其中又以匹配问题最为困难。同时,匹配也是计算机视觉中的基础问题,往往影响着其它相关问题的发展。本文主要研究双目视觉匹配算法。主要贡献如下:介绍了马尔可夫随机场(Markov Random Fields,MRF)建模及其主流优化算法,包括图割算法和置信度传播算法。简要阐述高阶MRF理论以及两种优化策略,包括专家场模型和鲁棒高阶图割优化算法。针对专家场模型,提出了一种自适应状态搜索空间缩减策略以提高算法执行效率。使用基于鲁棒高阶图割优化算法对匹配问题进行建模,对现有高阶能量项计算模型进行改进使其符合立体视觉匹配。实验结果表明,高阶MRF能够获得更丰富的图像信息,得到的匹配结果更为精确。对图像降采样方法进行了分析,提出了一种面向对象的基于多尺度超像素的立体视觉降采样方法,实验证明这种降采样方法能够有效保持图像原始结构信息。在此基础上,提出了一种基于过分割的自适应精匹配算法。将图像过分割信息引入匹配问题,利用MRF对匹配问题建模,构建一种新的基于分割的能量方程并使用分层置信度传播算法优化能量方程。通过使用多种局部匹配方法得到像素置信图和遮挡图,对图像进行过分割并假设属于同一个分割块的像素在实际场景中属于同一个物体并进行面拟合。在置信度传播算法迭代过程中自适应调整数据项并精化视差。实验表明,本文所提算法精度达到了主流算法的精度,能够有效保持物体轮廓信息,对匹配算法研究具有一定的推动作用。