论文部分内容阅读
多描述编码将信源输入编码成多个描述,每个描述可以被单独解码,多个描述可以联合解码以获得更好的解码质量。多描述编码的概念从其提出至今已有几十年的历史。多描述编码在编码理论和实践上都具有重要的研究价值。一方面,多描述编码是一个基本的编码理论问题,且与许多其他编码理论问题密切联系。另一方面,多描述编码是提高网络信息传输质量的有效方法之一。由于不同类型的信源有不同的统计特性,因此,在设计多描述编码器时,需要以现有技术为基础将多描述编码的基本原理与具体信源的特点相结合。本文从多描述编码的信息论基础出发,对离散信源、图像信源、视频信源上的多描述编码器的设计和优化问题进行了研究,以提高多描述编码在这些信源上的率失真性能。本文首先研究了离散信源上的多描述编码算法。在这一方面,现有的算法大都假设信源统计特性为已知,而在实际应用中,信源统计特性可能是未知的或时变的。因此,本文对多描述编码器的通用性进行了研究,使编码器能够在未知信源统计分布的情况下,通过不断地在编码过程中调整参数来优化其率失真性能。我们将Zamir和Rose提出的用于通用单描述编码的自然类型选择理论推广至多描述编码。我们提出了两种采用随机码书的通用多描述编码算法:一种恒定失真,另一种恒定权重;并给出了这两种算法的率失真函数,通过优化编码参数可以使它们与EGC (El-Gamal-Cover)边界重合。我们证明了重构码字的联合类型可以被用来改善整个多描述编解码器的率失真性能。基于上述理论结果和现有的多描述编码技术,我们提出了一种用于二进制信源的通用多描述编码算法。实验结果显示了该算法的有效性。图像信源的多描述编码技术呈现百花齐放的局面,时至今日人们已经尝试了多种不同的方法,这些方法通常各有优势。我们以现有的算法为基础,尝试将这些算法进行整合,以达到优势互补的效果,我们提出了一种基于组合优化的矢量信源的多描述编码器框架。在该框架中,高维信源向量被划分为互不相交的低维向量,每个低维向量从若干种低维多描述编码器中选择一种进行编码。在给定低维多描述编码器率失真性能的前提下,可以证明整个框架的率失真优化等价为一个组合最优化问题,且在某些情况下可以在多项式时间内求解。我们给出了一个对整个框架作率失真优化的算法,并将其应用到相应的图像编码算法中。实验结果显示我们的方法有助于进一步提高多描述图像编码的率失真性能。最近, stergaard和Zamir提出了基于“Σ-△量化原理”的多描述编码方法。虽然该方法在高斯信源上可以达到理论边界,但它在图像信源上的应用研究尚处于起步阶段。我们提出了一种基于向量Σ-△量化的多描述图像编码算法。该算法首先将图像变换成块序列,然后将向量Σ-△量化作用于块序列上,每个频率对应一个噪声成型滤波器。我们采用率失真优化的方法选择滤波器的系数和量化步长,该方法有效地缓解了基于Σ-△量化的图像编码中存在的Z-NZ(zero-to-nonzero)翻转问题。为了提升边解码器的主观解码质量,我们提出了一种后处理算法。实验结果显示我们的算法在PSNR和主观质量两方面均较以往的算法有所改进。不同于图像信源,在设计多描述视频编码器时,如何应对解码器与编码器在参考帧上的不匹配是需要解决的首要问题之一。该问题通常被称为漂移问题(drift problem)。该问题可能会导致视频质量严重下降。本文提出采用分布式编码的方法(Wyner-Ziv编码)来缓解多描述视频编码在丢包信道上的漂移问题。我们首先对Wyner-Ziv背景下的多描述编码(Multiple Descriptions in theWyner-Ziv setting,简称MDWZ)进行了研究,给出了一个渐进最优的码字构造方案。在此基础之上,我们提出了一种基于Wyner-Ziv编码的多描述视频编码算法。该算法采用MDWZ编码器实现帧间压缩,其两个边解码器可以互换边信息(即参考帧)且解码质量不会下降。当一个边解码器的参考帧由于丢包而损坏时,它可以使用另一个边解码器的参考帧解码,而在基于预测编码的多描述视频算法中,边解码器互换参考帧一般会导致漂移问题。实验结果显示我们的算法在丢包信道上有较好的鲁棒性。