基于H.264扩展架构的可伸缩视频编码关键技术研究

被引量 : 0次 | 上传用户:xj3301365
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络、通讯、信息家电、消费电子等相关领域内技术日新月异的发展以及市场迅猛扩大,多媒体服务,尤其是以视频内容为核心的流媒体服务,开始成为最具潜力的增值服务之一。面对目前和将来可以预见的渐趋复杂的流媒体应用环境(异构网络、带宽波动、终端设备多样化、服务提供商的灵活政策、终端用户的个性化要求),需要视频编码体系必须能够在较低的复杂度上提供时域,空域和质量可伸缩性编码。为应对这一挑战,2005年前后来自ITU-T和MPEG的联合视频小组(Joint Video Team,JVT)开始研究可伸缩视频编码(Scalable Video Coding,SVC)的标准化。在研SVC标准采用基于“H.264扩展(Extension of H.264)”的实现框架。H.264扩展既保留和兼容了H.264标准的高效,又增加了时域/空域,质量等伸缩功能。SVC标准将是第一个完整和全面支持伸缩性的国际标准,其标准化将是JVT在2005~2006两年内最重大的研究项目。毫无疑问,深入研究和跟踪该标准的发展也是本文最重要的研究意义之一。论文内容以SVC标准及其基于H.264扩展的实现框架为基础,总结了可伸缩视频编码的发展历史和现有视频编码体系在伸缩性方面的局限性,跟踪研究了JVT在研SVC标准及其需求和特点,重点研究了H.264核心的高效编码技术,研究了基于H.264扩展的SVC框架在时域、空域、质量等三方面的伸缩编码机制及其对H.264语法/语义的增修,设计了相关的软件测试平台。实现基于H.264扩展的可伸缩视频编码需要解决两类关键问题:其一是H.264核心的有效编码技术,其二是外围增加的高效伸缩技术。针对前者就运动估计、模式选择、码率控制等三个关键技术提出了改进算法或新算法;针对后者就空间伸缩的关键技术提出了改进算法。1)根据H.264多参考帧运动估计的特点,提出了“连续中心外螺旋搜索算法”。在运动估计的过程中,为充分利用相邻帧间运动估计的相关性,前一参考帧搜索到的最佳点作为下一参考帧的搜索起点,并沿以该点为中心向外螺旋的路径进行新一参考帧上的运动估计。此外该方法还集成了传统的连续消除算法(Successive EliminateArithmetic,SEA)。实验表明其运动估计精度和全局搜索(Full Search)相同,而计算量却缩小了25%。2)提出了一种基于梯度且支持RDO的帧间块模式抉择算法。由于H.264支持变大小块编码技术,显然遍历所有的模式去寻找满足率失真优化(Rate distortion optimize,RDO)代价函数最小值的最佳模式是最精确的方法,但其却最耗时。新算法根据宏块的梯度分布情况事先剔除某些可能性很小的模式,以减少RDO过程待选模式数目以达到快速选择模式的目的。实验表明新算法适应H.264块大小可变的特点,能够根据图像局部梯度变化选择合适的编码模式,比传统的全模式RDO方法节约80%左右的时间,而PSNR下降不超过2dB。3)提出了一种基于Basic-Unit级的码率控制方案。JVT建议的分层码率控制方案在Basic-Unit级采用平均分配码率。事实上,不同Basic-Unit的复杂度不一样,而且越复杂的Basic-Unit比相对更简单的Basic-Unit需要分配更多的码率才合理。显然JVT建议的平均分配方法不符合这一逻辑。新的方案考虑了不同Basic-Unit的相对复杂性,并据此重新调整了Basic-Unit间的码率分配,越复杂的Basic-Unit分配越多的码率,反之越少。结果表明,改进的方法在PSNR不降低的情况下可以获得更好的主观质量。4)提出了一个基于DCT核的空间上/下采样过滤器。在空间可伸缩视频编码中,分辨率的变换本质是一个上/下采样的过程,而采样过滤器的好坏对空间伸缩的性能和PSNR影响很大。由于DCT变换和最优的KL变换相近,故在图像/视频压缩中被常用。该方案是前向DCT和后向DCT的有效结合,下采样时舍弃DCT高频部分,上采样时高频部分补零。试验结果表明,该采样过滤器能够有效提高空间伸缩性能,比SVM标准采样方法获得1~3dB的增益。
其他文献
利用等价无穷小量作代换是计算极限的一种常用、方便、有效的方法。围绕无穷小之比、变上限积分的极限、幂指函数极限和Taylor公式,利用等价无穷小代换思想进行分析应用,以此
0—3岁婴幼儿早期教育是是当今社会关注的焦点之一,了解家庭的育儿需求能有效提高早教服务质量,优化婴幼儿生存环境,促进婴幼儿的健康发展。采用问卷法,从早教的模式、课程、
本文在充分分析近年来光伏发电领域重要研究成果的基础上,设计了一套单相光伏发电离网系统,对系统的拓扑结构、控制电路给出了详细的设计要点。以dsPIC30F4011为控制核心,实
首先介绍OpenCV中图像类型和函数处理方法,之后通过设计实例描述在VivadoHLS中调用OpenCV库函数实现图像处理的几个基本步骤,阐述从OpenCV设计到RTL转换综合的开发流程。本文
本文接着前文,沿马克思主义中国化的螺旋轨迹论述中国特色社会主义民族理论体系的转换生成轨迹。我国社会主义初级阶段的民族团结进步事业遭遇阶级斗争扩大化劫难之后,邓小平
由于计算机、网络以及信息科学的快速发展及在人类基因组计划的推动下,以生物信息的采集、处理、存储、传布和解释等多个方面为研究内容的生物信息学应运而生并得到很大发展.
提出了一种基于OPNET的短波通信系统仿真方法。该方法通过引入实测的电波传播损耗以及本地背景噪声实现了对电磁环境的仿真;通过引入调制解调器的信噪比仿真曲线实现了对系统
<正> 侗族虽分布在贵州、湖南、广西三省(区)接边地区及湖北省西南部一带.广西的侗族集中在北部的三江侗族自治县、龙胜各族自治县、融水苗族自治县、;罗城仫佬族自治县和融
以新疆伊犁河流域地区作为研究区域,在对研究区域典型土壤样品中重金属元素Cu、Pb、As、Hg的含量分析基础上,运用GIS地统计学知识分析研究区域土壤Cu、Pb、As、Hg含量的空间
本文针对智能车比赛用模型车底盘,从汽车理论的角度对转向轮定位参数、车辆的重心选择、侧滑等原理进行了介绍,并通过对转向轮定位参数、舵机性能以及模型车转向稳态性的测试