AVS立体视频编码研究

来源 :北京大学 | 被引量 : 0次 | 上传用户：tp137907226

【摘要】

：

立体电影的上马,譬如阿凡达的热映,引发了人们对立体电影的竞相追捧。立体电影的原理是利用人双眼的视角差和会聚功能,而产生了三维立体的效果。多视点视频技术,由于是立体电

【作者】

：

姜莲莲

【机构】

：

北京大学

【出处】

：

北京大学

【发表日期】

：

2012年期

【关键词】

：

立体视频视频压缩图像编码视差补偿

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

立体电影的上马,譬如阿凡达的热映,引发了人们对立体电影的竞相追捧。立体电影的原理是利用人双眼的视角差和会聚功能,而产生了三维立体的效果。多视点视频技术,由于是立体电影的技术基础,而成为了近来研究的热点。因此,多视点视频压缩技术的研究意义重大,前景广阔,十分值得深入地研究。多视点视频生成是由多个摄像机按照一定地几何排布后,对着同一场景,采集而成。由于拍摄的场景大致相同,每个摄像机所拍摄的视频内容往往是表现了同一场景,或仅仅有些不同,比如:物体因为从不同角度拍摄,造成了几何形变扭曲而已。这些相似的大量信息,在时域、空域上存在了大量的冗余信息,于是给视频数据的压缩提供了可能。目前解决的方式有很多种,包托利用当前的现有编码标准,比如:H.264/MPEG-4 AVC去直接编码每个视点下的各路视频,也就是所谓的直接编码方式。除此之外,MPEG-2提出了传统立体视编码的方法,也就是将两路对应于人眼距离的视频,利用时域和空域的依赖关系,压缩编码。目前最主要的方法是采用多视编码框架,由于层次B结构能获得更多的编码增益,因此JvT已经采用了层次B的框架作为标准。它的核心思想是分别运用运动补偿和视差补偿的方法,去掉时域、空域上的冗余信息。虽然国际上的标准已经对立体视频研究了很多年,并且相继制定了很多标准,国内对此研究仍然存在很多空白。AVS作为国内存有自主产权的核心编码标准,对于前沿的研究热点也责无旁贷地投入了研究工作。本研究分为两个部分：　　第一,提出了支持AVS立体视频编的系统层技术方案,并被采纳进AVS标准。通过本文所提的提案,可以使得AVS标准在两个层次上实现对立体视频编码的支持。在MPEG系列国际标准中,虽然MPEG-2标准仅支持简单的视间预测编码,H.264 MVC Profile能够支持基于视间预测的视频编码或者基于SEI的拼接编码,但对基于深度的立体视频编码没有任何考虑。相比之下,AVS则在系统和视频两个层次实现了对深度、视间预测等立体视频编码技术的支持。特别是若采用了双视点拼接编码框架,这种单一的多视视频流在视频层上与传统的视频流没有任何区别。在大量节约了码率的同时,也保证了观看质量,并且在实践阶段,此种方式已经提供给了电视观众立体的显示效果,让实时观看成为了可能。　　第二,提出了一种自适应的运动跳过模式。此种运动跳过模式(motion skip)在多视框架上,MOTION SKIP模式作为一种新的模式,被收录到研究模型当中。该模式参考附近视点序列中相关的宏块信息,包括:参考帧号,宏块编码模式,运动矢量,从而达到减少冗余信息的效果。然而,本文所提的方法,特别针对的是在AVS下采样辅助的双拼MVC编码框架。由于采用的是AVS编解码器,为了适应其最小粒度的编码单位,本算法采用了8像素精度的运动估计来获得参考图像到编码图像上的全局视差矢量。之后借助预定义窗口大小的细搜索过程,算法可以逐渐找到真实视差和GDV之间的误差。一旦得到最优偏移视差矢量,全局视差矢量会根据搜索结果不断完善优化自己以求达到最匹配真实视差矢量的效果。实验结果表明,通过改进GDV的获得方式,率失真性能得到了显着的提升。综上所述,针对在AVS上实现立体编码问题,利用系统层上的改进,实现了双拼框架和高清实时编码的系统层设计。提出了自适应的运动跳过模式,并通过实验展示了利用自适应地优化全局视差矢量,可以进一步提高编码效率。

其他文献

基于人工生命的蜂群行为的仿真与研究

本文采用人工生命的方法来研究蜂群复杂的行为。首先,在对蜜蜂个体的行为进行分析和归纳的基础上,建立了蜜蜂的感知模型、环境模型、移动规则、觅食规则、避障规则、记忆规则

学位

人工生命蜂群行为群体智能网络爬虫

面向用户可定制工作台及科学工作流关键技术研究

随着计算机应用的快速发展和普及，现代软件逐渐呈现出规模越来越大、复杂性越来越高、生命周期越来越紧、功能要求越来越强等特征，这也从客观上要求必须提高软件的可扩展性。近

学位

软件开发可扩展性开放网关服务协议科学工作流指纹识别

基于捕获/重放的Web应用跨浏览器兼容性检测工具的设计与实现

随着互联网以及Web技术的快速发展，Web应用成为重要的信息获取和交流平台。应用开发者希望应用能在各种主流的浏览器平台上表现一致，但由于浏览器实现技术的差异以及对标准支持

学位

Web应用跨浏览器兼容性检测工具捕获事件重放事件

股票市场预测的文本挖掘技术和系统实现

本文研究历史网页文档与股票市场行为的相关性,并建立预测模型来深入分析和定量评估网页文档在股票市场预测中的作用和效果。通过中国网络信息博物馆(Web Infomall[1])的历史

学位

股市预测数据挖掘语义标注程序语言

基于Maze平台的Trust--Based推荐模型的设计与实现

计算机科学技术的发展和互联网应用的普及已经将人类社会带入了信息化的时代。信息化时代的到来在给我们的工作、学习和生活带来无限便利的同时也引发了一些问题。这其中“信

学位

数据挖掘个性化推荐信息过滤程序语言

基于云存储的客户端缓存文件系统的研究与实现

云存储是一种新的存储服务模式,运营商通过网络为客户提供存储资源和存储服务,具有安全、可靠、可扩展等特性。单机存储与云存储相比,具有难扩展、数据容易丢失损坏、且难迁

学位

网络数据库云存储系统数据缓存程序语言

CARSI联盟用户信息发布中隐私保护的研究与实现

教育科研网统一认证和资源共享基础设施(CARSI)是由北京大学发起的一项跨域认证和授权项目,采用SAML标准,以Shibboleth技术为基础,用来加强高校间的资源共享。目前世界上有31

学位

计算机网络网络安全身份标识软件工具

物联网软件体系结构设计及实现方法研究

随着感知技术、普适计算技术、通信技术和智能控制技术的快速发展，智能硬件越来越广泛地应用到社会生活的各个领域。基于智能硬件的互联与互操作，可以构建物联网系统，实现社会空

学位

物联网软件体系结构功能模块社会空间需求演化机制设计模式

基于Google Map的地理位置查询系统

随着GPS技术的不断完善和发展,基于位置的服务LBS(Location-Based Service)也呈现出多样化的发展趋势,应用领域不断得到扩充,如电子地图系统、旅游信息查询系统、日常兴趣点

学位

句子相似度地址相似度语义相似度词序相似度

针对二进制程序的动态漏洞挖掘技术研究

威胁软件安全最大的问题就是软件漏洞。由于软件漏洞的存在，大量的计算机病毒、蠕虫或恶意用户都可以利用软件中存在的漏洞进行信息窃取或提升权限等行为，严重威胁了个人乃至国

学位

软件检测安全漏洞数据挖掘二进制程序

AVS立体视频编码研究

与本文相关的学术论文