论文部分内容阅读
立体视觉是计算机视觉的核心研究领域。经过几十年努力,视图几何关系的研究取得突破,理论逐步完善,方法逐渐成熟,立体匹配的研究也取得很大进展,人们将视差场描述为马尔科夫随机场,将立体匹配表述为像素标号问题,采用图割算法和置信传播算法估计视差场,取得很好的实验结果。近年来,出现了三维可视通讯、基于图像的绘制等新兴应用领域,这些领域对立体匹配提出新的要求。本文针对这些新兴应用领域,围绕质量和效率两个要素,以马尔科夫随机场为描述工具,以图割算法为求解工具,对立体匹配问题开展研究。主要贡献包括:1.提出像素标号的二分法。首先将整个标号集赋给每个像素,然后将标号集一分为二成为两个子标号集并舍弃其中一个子集,如此循环直至标号集仅含一个标号为止。通过这种方式将多值标号问题转换为一系列二值标号问题,从而提供了NP难问题的一种近似解法。进一步解释上述标号过程,并据此构造优化目标函数,证明所构造目标函数可以利用图割算法进行优化。在此基础上,设计像素标号的置位算法,算法复杂度为log2n(n是标号数目),而目前同类算法中效率最高的扩张算法(α-expansion algorithm)复杂度为n*k(k>1)。应用置位算法求解立体匹配问题并与扩张算法进行比较,结果表明:在匹配质量相当的基础上,二分法具有很强的效率优势。像素标号的二分法对立体图像没有特殊要求,方法具有很强通用性,而且还可以应用于图像恢复、运动估计等领域。2.提出双层立体匹配方法。回顾和分析现有分层立体匹配方法,针对前景和背景彼此分离并各自连续的场景,提出首先确定前景层视差场和背景层视差场,然后组合成为整体视差场的匹配方法,从而将整个匹配分解为一系列二值标号问题,避免模型拟合与迭代改善。在此框架下,进一步给出融合颜色、对照度和形状等信息划分前景区域和背景区域的目标函数。实验结果表明:双层立体匹配方法大大改善了匹配质量。与分层动态规划方法比较的结果表明:双层立体匹配方法在质量和效率方面都具有一定优势。3.基于上述两个方法,给出三维可视通讯系统中凝视校正和前景背景分离两个关键技术问题的解决方案和实现技术。特别地,提出基于双层表达的视图合成算法,提出基于像素标号二分法的前景背景分离算法。进一步给出实验结果,表明方法的有效性。