论文部分内容阅读
立体匹配是计算机视觉领域的重要研究课题之一,它试图从两张具有重叠区域的二维图像中寻找同名点,并将对应信息记录在一张视差图中,结合摄像机参数,即可从视差图恢复出参考图像的三维模型。如何根据立体图像对准确地计算参考图像的视差图是立体匹配的基本任务,也是基于立体图像对对场景进行三维重建的关键。随着计算机视觉技术的发展,双目立体匹配技术也在越来越多的行业中得到应用,如机器人测距、避障和考古行业中对文物和发掘场景的三维重建,本文研究即受到后者的启发。实践发现,摄自考古发掘现场的立体图像对有其特殊性,图像中包含大量接近土色的近似纹理区域。在这些区域,搜索范围中的待匹配点仍具有某些可区分的特征,但这需要应用分辨能力更强的代价匹配函数才能准确辨别。此外,为了得到分辨率更高的视差图,立体匹配过程也需要采用对应的高分辨率图像进行计算,而这些图像的分辨率可以达到数百万乃至千万像素,已经远远超出了传统立体匹配应用图像在十万至百万像素的级别。输入数据量的增加对立体匹配算法的计算速度提出了更高的要求,许多研究者已经意识到这个问题,开发计算效率更高的立体匹配算法也成为当前立体匹配研究的一个重要方向。本文将上述应用问题归纳为一类较为一般的学术问题—基于高分辨率近似纹理立体图像对的立体匹配问题,并从三个方面进行了研究:(1)对具有更高辨析能力的代价匹配函数的研究。传统的代价匹配函数具有初始代价计算与代价累积两个阶段,其中代价累积阶段对于代价匹配函数的辨析能力具有决定性的作用。结合图像分割技术,本文提出了新的代价累积策略,并在两种不同类型的初始代价算子,Census变换和自适应支持权重策略上进行了测试,实验结果表明,本文提出的代价累积策略显著提高了代价匹配函数的辨析能力,在同类别代价匹配函数中达到了最低的平均误差率。(2)对具有更好的平滑能力和适应能力的全局优化算法的研究。全局优化算法以马尔科夫-最大后验概率(MRF-MAP)框架为理论基础,通过求解一个能量函数来寻找每个位置的视差,置信度传播(Belief Propagation)是其中应用最广的优化方法。本文首先改进了经典的层次式置信度传播算法,在其中加入了基于B样条拟合的去噪与平滑模块,获得了更加平滑、精度更高的视差图;还提出了一种基于异步消息传递的置信度传播算法,算法在具有与经典置信度传播算法相当的收敛速度的基础上,具备更好的去噪能力,耗费的存储空间也更小。另外,基于异步消息传递的置信度传播方案,本文综合几种现有技术设计了一个完整的立体匹配算法并进行了实验,其平均误差率当时在标准测试集上排名第六。(3)对具有可扩展性的混合式立体匹配方案的研究。本文首先分析了当前研究者对加速立体匹配算法的研究进展,然后设计了一种混合式立体匹配计算框架。框架采用了当前应用最广泛的立体匹配技术,如多核CPU和GPU加速技术,基于平面拟合的视差估计技术等,并将这些技术进行了有机的结合。使用本计算框架在局部和全局立体匹配算法上进行了测试,结果表明,本框架能够进一步提高局部立体匹配算法的计算速度,也能够有效降低全局立体匹配算法对于内存的峰值需求。同时,通过充分利用系统的多种计算资源,本框架也具有很高的扩展性。本文对基于高分辨率近似纹理图像对的立体匹配技术的研究涵盖了立体匹配技术当前的研究热点问题,并提出了行之有效的解决方案。实验结果表明,本文提出的多种解决方案是有效的,在基于标准数据集的测试中也取得了良好的效果。