论文部分内容阅读
该文首先对影响帧估计和内插的各种因素加以分析,对当前的立体视频帧估计和内插算法—基于固定块匹配的FSBM算法中存在的各种问题进行了实验和讨论,指出了提高重建帧估计精度的关键在于解决重建帧中运动区域的运动匹配以及运动遮挡问题,而提高重建速度的关键在于提高运动估计的速度.因此提出了一种基于运动和亮度信息的不规则四叉树运动估计和分割方法(简称IMRQT法).在运动估计的同时进行分割,在分割时综合了运动和图象亮度信息,使得分割位置发生在与尖锐的运动不连续的地方最接近的位置(如物体的边缘),避免了块运动估计中存在的块状可视干扰,保留了运动细节.在进行运动估计和分割时,还使用多分辨率结构以降低计算负担.在基于IMRQT的运动估计和分割结果上,又提出了新的立体视频帧估计方法,将被重建的图象分为运动匹配区域和运动失匹配区域,给出了对于这两类区域进行预测和填充的方法.与当前算法相比,基于IMRQT的立体视频帧估计方法比FSBM方法帧重建的速度提高了约20倍,图象信噪比提高1.27dB~3dB,并具有较好的估计精度和主观观感.在帧估计和内插时如果利用被编码传输的参考帧的运动和视差矢量场,就可以避免在解码端重做运动/视差搜索估计.为此该文利用立体透视投影几何模型,推导出立体视频中邻接帧之间视差矢量场与运动矢量场之间的对应关系,并将这种关系应用于立体视频的帧估计之中,提出在立体视频的两个邻接立体图象对中,当其中一幅图象未知时,可以通过其余3幅图象以及它们之间的视差和运动场来准确估计该未知图象的方法:对于非视差遮挡区域中的象素点,利用视差和运动矢量之间的对应关系获得该内插点的映射位置和映射强度;对于视差遮挡区域中的象素点,可根据视差遮挡的特性及其约束条件,定义一个合适的置信度检验方法构造代价函数,利用其邻域中非视差遮挡区域象素点所对应的运动矢量来估计其对应的运动矢量并进行映射,以得到该象素点的位置和强度估计值.该文称这种方法为基于运动/视差方程及最小代价方程的立体帧估计与内插方法(简称MDR_LCF方法).该文提出一种与区域分割技术相结合的视差场校正技术,对含有大量误匹配的视差场进行校正,不仅可以对整个视差场进行平滑还可以在检测出具有较大误差匹配的视差矢量值的同时对错误视差矢量进行校正,并具有简单易行的特点.作为立体视频帧估计的扩展,该文研究了图象分割技术在中间视生成和内插中的应用,提出了一种快速合成中间视图象的方法.该方法具有低的计算复杂性和良好的内插视觉效果.