基于率失真优化的可伸缩视频编码码率分配研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ylg2008asp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,网络和移动通讯技术的迅猛发展使视频编码的目标从传统的面向存储转变为面向网络传输。可伸缩视频编码能够使生成的码流具备空域、时域以及质量可伸缩性,从而能够在时变带宽异构网络中进行鲁棒的视频信号传输。在视频流的传输过程中,由于带宽的波动或者终端设备不同,需要采用快速而又高效的码率分配技术来截取特定条件下最优的一段码流。针对这种需求,本文对可伸缩视频编码中的码率分配进行了研究。JPEG2000采用了优化截断的嵌入式块编码算法(EBCOT),对静止图像的压缩具有很高的编码效率和良好的码流可伸缩性。JVT组织正在制定的JVT SVC是基于高压缩率标准H.264/AVC的可伸缩视频编码标准,它采用了很多先进的可伸缩编码技术。因此,本文首先对JPEG2000的EBCOT和JVT SVC进行研究,重点分析了其中基于率失真优化的码率分配技术,为本文码率分配方法的设计提供借鉴思想。在此基础上,针对现有JVT SVC中以FGS NAL单元为单位计算的率失真信息不能精确表示码流的率失真特性这一缺点,提出了通过划分FGS NAL单元建立其近似的率失真特性曲线,从中选择构成凸壳的点作为率失真最优的候选截断点,并以此进行码率分配的方法。该方法更加精确地表示了码流的真实率失真特性,从而实现更加优化的码率分配。实验结果表明,相对于JVT SVC中现有率失真优化的码率分配方法,在截取相同需求条件下的码流时,新方法的解码视频质量均有进一步的提高。在对JVT SVC现有码率分配方法的研究发现,计算每个FGS NAL单元对解码视频序列失真影响时需要反复解码整个视频序列,存在计算复杂度过高的问题,为此本文又提出了一种利用模型估计失真的快速码率分配方法。在假设残差系数服从拉普拉斯分布的前提下,通过计算量化误差,分析各帧之间预测关系,建立失真估计模型,并根据每一帧残差系数的概率分布动态更新模型参数。实验结果表明,这种快速的码率分配方法使解码次数降低近50%,码率分配平均运行时间降低45.3%,而解码视频质量的损失平均仅为0.04dB,说明本文提出的快速码率分配方法达到了快速而高效的码率分配。
其他文献
目标跟踪技术是机载光电系统的核心技术之一,该技术用于在机载环境下完成地面背景的机动目标跟踪。本研究旨在改善该系统现有跟踪技术,提高单目标长时跟踪的性能。目前机载平台
GPS导航系统已经成为在精确打击武器方面有着广泛的应用。如果能成功破坏GPS系统的工作,就能大大减少新一代精确打击武器的效果,削弱敌方的侦察、调度、后勤保障等对于战争来说
二十一世纪是信息技术时代,同时也是生物技术时代,生物信息学正是二者的有效结合,它利用计算机科学技术解决生物学中的各种问题。随着人类基因组计划的完成,生物学走向以功能基因
对等网络(Peer-to-Peer)作为一种新兴的网络计算模式,打破了传统的C/S模式,其应用越来越广泛。随着P2P网络应用的日益盛行,分布式搜索技术已经成为搜索领域中研究的关键问题
燃烧假人测试,是指对穿着防火服装的等比例假人模型,施以实验室条件下、可控的高强度火焰,通过假人模型上分布的若干个热传感器测量和计算透过被测服装传到假人表面各部位的
语言模型在语音识别中占据着重要的地位,它担负着把拼音转化成汉字的重任,语言模型性能的好坏直接影响到语音识别的结果好坏。当前应用最广泛的语言模型是基于统计的语言模型
随着微电子技术和计算机软硬件技术的发展,嵌入式系统的性能得到了极大的提高,功能日益丰富,应用也越来越广泛。传统的边界防火墙是保障网络安全的重要手段,但是它存在防外不
XML以其扩展性、结构性、平台独立性和自描述性等特性成为数据表示和交换的事实标准,越来越多的应用使用XML来存储、交换和发布信息。能否有效地存储和查询XML文档,成为一个非
企业的成功日益依赖恰当的人在恰当的时间及时地获得对企业决策至关重要的信息,获得这样的信息直接依赖于数据库的性能。而数据库的性能与数据库结构有着直接的关系,良好设计的
投资者在进行交易前需要做很多的工作,那就是投资的研究和分析。要进行投资研究和分析,首先需要获取市场交易数据,没有数据就无法进行研究和分析。本文的主要目的就是为实时交易