论文部分内容阅读
一些视频终端设备如移动可视电话、无线PC摄像机由于受到计算能力、电能容量等方面的制约,其性能上要求低计算复杂度的视频编码算法。而解码端具有丰富的计算资源,可以承受复杂的计算。在这种应用场合,传统视频编码结构难于适用。近年被提出的基于Slepian-Wolf和Wyner-Ziv编码理论的分布式视频编码(DVC)能较好地满足这种计算能力受限的视频终端设备的需求。目前分布式视频编码已成为了国内外的研究热点。
本文对分布式视频编码进行研究,分析当前存在的技术问题并重点研究其中的部分关键问题:如何降低现有Turbo码译码算法的计算复杂度和如何精确估计边信息。
Turbo码具有良好的性能使得其可以有效地实现Slepian-Wolf编码器,然而译码性能高的Turbo码译码算法通常具有较高的计算复杂度。目前Turbo码常用译码算法有最大后验概率(MAP)译码算法和软输出Viterbi算法(SOVA)。Log-MAP算法是MAP算法在对数域上的转换形式,其简化了MAP算法计算复杂度并具有优越的译码性能。SOVA算法具有较低的计算复杂性,而其译码性能比Log-MAP算法弱。由分析可知,这两种译码算法均可输出比特判决的对数似然比,因此Turbo码解码器的两个分量译码器的译码算法可以不一样。本文提出采用SOVA算法和Log-MAP算法的混合译码结构。此结构折中了单独采用SOVA算法或Log-MAP算法译码的计算复杂度,同时可取得较好的译码性能。
边信息是分布式视频编码系统的一个重要组成部分,其影响着系统的解码性能。目前大部分构造边信息方法中的运动估计采用了全局搜索方式搜索最佳匹配块,由此造成大量运算的耗费。对此,本文提出了改进的基于卡尔曼滤波的运动估计结构。该改进结构将卡尔曼滤波器结合前向运动估计和双向运动估计去计算视频帧的子块运动矢量。它首先通过卡尔曼滤波器预测最佳匹配块的位置,然后使用传统运动搜索算法在此位置的小邻域内再搜索最佳匹配块,最后卡尔曼滤波器和双向运动估计修正运动矢量,从而避免了全局搜索方式计算运动矢量。相比传统边信息构造方法中的运动估计结构,该改进结构能够在降低计算复杂度的同时改善边信息质量。