面向视频编码标准应用的帧间预测技术研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:leidyteam
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在计算机技术以及网络通信技术,特别是移动计算和移动通信技术飞速发展的背景下,视频应用正在以前所未有的速度迅猛增长。同时,视频应用中网络和终端多样化的特点也呈现地愈发明显。网络视频点播、高清电视直播、视频电话、视频会议、视频监控等基于视频的应用形式正在广泛而深远地影响着人们的工作和生活。作为视频技术能够得到广泛应用的一个必要条件,视频编码的标准化已经经历了数十年的发展历程,产生了一系列的视频编码标准。从早期的H.261、H.262/MPEG-2、H.263等等到目前主流的H.264/AVC,以及最新的HEVC等。每一代视频编码标准都提供了一系列的编码工具,视频应用开发者可以自由地利用编码标准所提供的编码工具产生符合标准的码流,而编码标准对于编码工具的定义也在很大程度上决定了采用该编码标准所能达到的编码性能。目前主流的视频编码标准均采用了基于预测、变换、量化、熵编码的混合编码框架。其中,帧间预测是编码器挖掘视频信号的时间相关性的主要手段。帧间预测技术对视频应用有两个方面的影响:首先,帧间预测的效率对编码的整体效率有很大的影响,帧间预测的效率涉及预测信号的精度和预测信号所需的运动信息开销两个方面,预测信号越精确、运动信息开销越小,则预测的效率越高;其次,帧间预测导致帧与帧之间的数据依赖,这种依赖制约了码流的适配能力,而视频编码标准中对码流适配的支持(如实现随机接入、码流的时间可伸缩等)通常对应着某种程度上对参考关系的切断。在标准和应用层面需要合理地定义和配置编码的参考关系,以达到编码效率和码流适配能力的平衡。本文面向当前主流的视频编码标准,以帧间预测技术为主要研究内容,从预测信息的编码效率和码流适配能力两个方面对现有的帧间预测编码方法进行了研究。一方面针对基于运动矢量竞争的运动信息编码方法进行了改进,降低了码流中描述预测信号所需的数据开销,进而提升了帧间的整体编码效率;另一方面深入研究了感兴趣区域可伸缩编码场景下的帧间预测数据依赖问题,在标准兼容的基础上提供了感兴趣区域可伸缩及可重写的高效编码方法。本文的主要工作及创新点如下:1.面向基于运动矢量竞争的运动信息编码技术,提出了基于区域划分准则的运动矢量编码方法。该方法使用基于欧氏距离的区域划分准则进行运动矢量预测选择,以便对运动搜索的备选搜索点集合按照区域划分的方式进行分类处理。对属于特定类别的运动矢量在解码通过直接推导的方式获得编码端的竞争矢量选择信息;而对其他分类的运动矢量,利用数据隐藏的方法将竞争矢量的选择隐藏在运动矢量残差的奇偶性当中,通过在KTA及TMuC参考软件平台进行实验仿真,证明了该方法在编码效率上显著优于传统的竞争矢量编码方法。2.面向H.264/SVC的可重写SVC编码技术,提出了空间及感兴趣区域可重写的SVC编码方法。感兴趣区域可重写及空间增强层的可重写特性对提升H.264/SVC码流向H.264/AVC用户提供兼容服务的能力有重要意义。针对H.264/SVC不支持空间可重写的缺点,本文方法利用变换域的帧间残差上采样技术克服了空间增强层层问残差预测计算量大的问题,实现了空间增强层可重写编码。同时,针对H.264/SVC中感兴趣区域编码场景下感兴趣区域边缘非整像素对背景区域数据依赖的问题,本文采用了基于率失真优化准则的解决方法,在支持感兴趣区域可重写特性的前提下,取得了标准兼容性、压缩效率、以及解码漂移这三者之间的良好平衡,同时,针对仍然存在的解码漂移,利用关键帧技术控制可能产生的错误传播,进一步提高了总体编码效率。通过在JSVM参考软件平台进行实验仿真,证明该方法在保留感兴趣区域可重写特性的同时显著提升了编码效率。3.面向H.264/SVC增强层感兴趣区域编码,提出了基于辅助编码环路的SVC增强层感兴趣区域编码方法。该方法在增强层感兴趣区域进行单独解码时,利用基本层信息生成背景区域的近似信号用作参考,并在编码端维护了与感兴趣区域单独解码场景相对应的辅助编码环路。在该编码环路中,利用基本层信息,通过错误隐藏的方法生成参考信号(虚拟参考帧)的背景区域,而感兴趣区域则以虚拟参考帧为参考进行重建。编码的模式选择过程综合考虑两种解码场景下的率失真代价进行。在增强层完整解码时,解码环路与编码端的主编码环路相同步,而感兴趣区域单独解码时解码环路与辅助编码环路相同步。由上述过程生成的码流与H.264/SVC标准兼容,在支持感兴趣区域可伸缩编码的同时保证了编码效率、避免了错误传播的影响。论文在JSVM平台上与现有方法进行了对比仿真,实验结果表明该方法在感兴趣区域可伸缩的场景得到了优于现有方法的编码性能。
其他文献
未来的人工智能技术将深刻影响酒店业的经营。当前台接待、餐厅服务、客房清扫工作都能由机器人完成时,酒店会按照"人类+智能机器人"编组模式重新设计组织结构,人类员工的工
终末期肾脏疾病(ESRD)是各种进展性肾脏疾病的最终结局,美国K/DOQI指南中将肾功能不全的程度分为5期,其中第五期——终末期肾脏疾病(ESRD),为需要肾替代治疗(血液透析、腹膜透析或肾移
根据南麂列岛的国胜岙,大沙岙和上马鞍等3条潮间带的底栖藻类监测结果,结合同区域的水质及底质环境质量,初步评价了该3个区栖藻类的生态种群,密度,形状及季节变化与环境质量之间的关
产业是经济的命脉,是决定区域地位的关键因素.在市场竞争异常激烈和冲突广泛存在的今天,中国经济正处于产业转型升级的'阵痛期',产业结构优化问题迫在眉睫.江苏省作
期刊
运用分形理论对苏北城镇体系的规模分布和城镇空间结构进行了具体分析,得出如下结论:在城镇规模分布方面,中等位序的城市较多,人口分布比较均衡,但这并没有很好地促进区域经
聚碳酸酯(Polycarbonate,PC)饮水桶已经成了日常生活的必须品,PC饮水桶安全问题也日益严重。针对PC材质饮水桶中掺杂回收料的现象,本实验通过反复熔融挤出模拟PC的回收过程自
分别采用醋酸铜、硫酸铜、氯化铜和硝酸铜等4种不同铜源,制备出不同形貌的草酸铜前驱体。通过焙烧草酸铜前躯体,得到相应宏观结构由纳米晶构筑的氧化铜样品。用TG、SEM、XRD
认知无线电技术是解决频谱短缺与频谱利用率低下这一矛盾的有效方法,它通过允许非授权用户在不影响授权用户工作前提下动态使用频谱来实现频谱的高效利用。认知无线Ad Hoc网
在骨折病治疗中都根据肾主骨、肝主筋为理论,骨折虽属暴力所致的局部病变,但可以影响到五脏,特别是肝肾之功能的失调。临床实践认为,气血津液是充养骨骼的重要物质,肝主筋、
随着嵌入式计算技术、传感器技术和通信技术的迅猛发展,无线传感器网络由此应运而生,并在军事、环境监测和保护、医疗护理、建筑、工业、农业、智能家居系统、仓储管理等许多