分布式视频编码关键技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:shouquanwenjian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动通讯技术的快速发展,越来越多的移动设备具备了摄像功能。由于移动设备的计算能力和电池持续时间通常比较有限,它们往往要求视频编码器比较简单。现有视频编码标准如MPEG-x H.26x和中,intra帧采用独立编码,编码复杂度较低,但只利用空域相关性,压缩效率不高;inter帧采用联合编码,可以同时利用空域和时域相关性,压缩效率高但是编码复杂度也很高。因此,混合编码标准并不适合移动设备。为了提供低复杂度、高压缩率的编码器以满足移动设备的需求,研究人员提出了分布式视频编码(DVC:distributed video coding)方法。在DVC中,编码器独立编码每帧图像但解码器联合解码Wyner-Ziv(WZ)帧图像。通过独立编码,DVC编码可以达到与intra编码相当的复杂度;而通过联合解码,DVC把运动估计等计算复杂的模块从编码器转移到解码器,并在解码器端利用时域相关性,从而可以达到比intra编码更高的压缩性能。  虽然分布式视频编码在理论上提供了一种低复杂度、高压缩率编码方案,但它还处在发展的初期阶段,压缩效率与inter编码相比还有很大差距,有很多问题需要研究:1.分布式视频编码压缩效率不高,这主要是由边信息质量不高,WZ帧与边信息之间的相关性模型估计不够准确等导致的,2.WZ帧经常出现块效应而且质量波动剧烈,严重影响视频的主观质量,3.DVC编码框架包含反馈信道且要求解码器在线解码,大大限制了DVC的应用等等。本文主要从提高压缩效率和主观质量两个方面进行了研究。  为了提高分布式视频编码的压缩效率,我们主要从提高边信息质量方面进行了研究。首先研究了生成边信息时解码器无WZ帧信息的情况,提出了基于多个运动补偿预测帧的贝叶斯边信息生成方法。与传统的边信息生成算法只利用单个运动矢量场不同,本文借鉴视频编码中多假设运动补偿技术的思想,利用多个运动矢量场生成多个预测帧,并用贝叶斯估计的方法融合这些预测帧。生成多个运动矢量场时,采用变块大小运动估计策略以处理不同尺度的图像内容,并提出新的代价函数以提高运动估计的准确性。融合多个预测帧时,同时考虑了视频帧的空域(帧内)相关性和时域(帧间)相关性,并提出了估计时域相关性模型参数的方法。实验结果表明,提出的算法可以显著提高边信息质量。  虽然上述算法可以提高边信息质量,但由于生成边信息时解码器没有帧WZ的任何信息,边信息质量的提高相对有限。为了进一步提高边信息质量,我们研究了逐步求精的边信息生成方法,这类方法中,帧的解码分多个阶段完成。随着解码阶段的进行解码器可以获得越来越多的WZ帧信息,从而可以生成越来越高质量的边信息。本文提出了两种逐步求精的边信息生成方法:基于棋盘分割的边信息生成方法和基于WZ帧重构信息的边信息生成方法。第一项技术将WZ帧按基于块的棋盘模式划分成两个子WZ帧,编码器独立编码而解码器顺序解码两个子帧。解码完第一个子帧后,可以利用它的重构为第二个子帧生成相比于初始结果更准确的运动矢量场和更高质量的边信息。第二项技术利用传统方法输出的WZ重构帧进行运动估计,为WZ帧生成相比于初始结果更准确的运动矢量场和更高质量的边信息,并利用该边信息对WZ帧进行第二次重构。这两种技术都可以有效提高边信息质量,从而提高WZ帧质量。本文还有机结合了基于棋盘分割的边信息改进技术和基于WZ重构帧的边信息改进技术,提出了一种新的边信息生成算法。  在上述两类边信息生成方法的基础上,我们还研究了利用其它辅助信息进一步提高边信息质量的方法,目前只在监控视频编码中探讨了这个问题。针对监控视频背景变化缓慢的特点,提出为每个GOP(group of pictures)编码一个高质量背景帧作为辅助信息。背景帧可以为WZ帧的背景区域提供高质量边信息,从而降低该区域的码率。实际编码中,利用背景帧将WZ帧分成前景区域和背景区域,并且只编码前景区域,解码时则直接用背景帧填充背景区域。实验结果显示,提出的算法可以显著降低WZ帧的码率。  在提高视频主观质量方面,本文研究了WZ帧去块效应问题,提出了一种基于最大后验概率估计( MAP)的去块效应算法。提出的方法根据图像先验模型和边信息条件概率模型,基于边信息和WZ重构帧对原始WZ帧进行MAP估计。MAP估计方法通过引入图像平滑先验去除块效应,但同时也常常导致过平滑而损失图像细节。为了避免这个问题,我们提出一个准则来区分块效应区域和非块效应区域,并且只处理块效应区域。实验结果表明,提出的算法在有效去除块效应的同时很好地保留了图像细节,有效提高了WZ帧的主观和客观质量。  本文还研究了另一个影响视频主观质量的问题:视频质量波动剧烈的问题,并提出了WZ帧和关键帧的质量控制算法解决该问题。文中形式化描述了WZ帧的质量控制问题,并将它转化为所有DCT频带量化器的联合自适应设计问题,还提出一种低复杂度贪心算法来求解该问题。另一方面,为了控制关键帧质量,本文结合已有指数D-Q(失真-量化参数)模型和线性 QP-PSNR(量化参数-峰值信噪比)模型,设计了一种多遍质量控制策略。实验结果表明,提出的算法有效解决了分布式视频编码中的质量波动问题。
其他文献
进入21世纪以来,随着Internet等基础设施的迅速发展,以及信息产业的快速发展,世界经济一体化进程空前加速,世界的联系日益紧密,在这种浪潮下,人们对获取用非母语表达的信息和
随着科学技术的发展和科学研究的需要,延迟容忍网络(Delay-TolerantNetwork)开始出现。本文以延迟容忍网络的路由算法为主要研究对象。叙述了延迟容忍网络的技术背景和协议框
P2P网络是在应用层建立的逻辑网络,它能够灵活高效地利用网络中闲置的资源。网络中各个节点之间的逻辑或物理互联关系形成了P2P网络拓扑结构。P2P网络中逻辑网络与物理网络不
随着我国国民经济的快速发展,税务、国库、银行的涉税业务量迅猛增加。同时,国税、国库、银行等部门各自的业务已基本实现了信息化管理。为了提高税务、国库、银行的工作效率
进入21世纪以来,人们加快了高科技发展的步伐,人们生活中,视频聊天、视频会议、网络电视、高清电视等已经非常普遍,这些应用导致了巨大的视频数据,对存储以及网络传输构成了
随着网络技术的不断发展和数据存储技术的广泛应用,每天都有大量的数据产生。在这大量的数据中,存在着许许多多的错误数据,尤其是在数据库合并过程中,产生了大量的相似重复数
目前,医生在对疾病的临床诊断和治疗方法的研究中都离不开对医学图像信息的借鉴与运用。现在的医学图像成像技术的发展日新月异,与此同时医学图像成像设备也是种类繁多并且应
大规模的商业网络存储系统为用户提供了不受地域限制的存储服务,为人们的日常生活和工作带来了极大的便利。免费存储服务FSS(Free Storage Service),如电子邮箱(Email)、网络
网格计算是当今计算机科学领域最新兴起的一项有很高学术价值和应用价值的研究课题。如何高效地使用网格资源即网格调度问题,随之成为研究的重点。任务调度是网格计算的核心
点对点技术(peer-to-peer,简称P2P)又称对等互联网络技术,是一种网络新技术,依赖网络中参与者的计算能力和带宽,而不是把依赖都聚集在较少的几台服务器上。P2P网络的一个重要的目标