基于视差的恰可察觉误差模型的立体视频编码研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:cherry_20050901
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,由于人们对逼真的视觉体验需求逐渐增强,3D电视技术的发展十分迅速。由不同视角的多台摄像机捕获同一个场景所产生的多视点视频,可以给用户带来更生动的视觉体验。然而,随着摄像机数量的增多,立体视频的存储空间和传输带宽会成倍的增加。因此,在视频处理领域如何进行有效的立体视频压缩尤为重要。由于通常情况下视频信号的最终接收者是人类视觉系统(HVS),所以由人类视觉感知因子和视频编码的融合形成的感知立体视频编码受到了极大的关注。在本文中,通过对H.264和多视点视频编码(MVC)的深入研究,描述了多种恰可察觉误差模型(JND)的建模和估计算法,并且将此类模型应用于图像、视频编码,剖析了各自的优点和对应的缺点。通过视差与人类视觉敏感度的关系首先提出了一个改进的基于视差的恰可察觉误差模型的估计算法;其次,提出了一个基于人类色度感知的色度域JND模型;然后,考虑到深度注意模糊理论(DOF)与人类视觉的特性,优化了基于视差的JND模型;最后,将这些模型用于立体视频编码,不仅有效的压缩了码率并且改善了图片、视频的感知质量。本文深入讨论了JND模型的算法改进以及与视频编码的结合,主要从以下几个方面开展了工作:1.提出了一个基于视差的JND模型。基于图像分割的立体匹配得到边缘更加准确的视差信息,利用视差和人类视觉敏感度改进了传统的时间和空间JND模型,并用于立体视频编码。实验结果证明,改善后的方法有效的减少了双目立体视频的视间冗余,并降低了码率。2.提出了一个基于人类色度感知的色度域JND模型。根据视锥细胞在视网膜上的分布,利用高斯分布来建模,并且应用到MVC编码中。实验结果显示,本方法在保证了色度感知质量的前提下成功的消除了色度冗余,节省了码率。3.通过深度模糊理论和JND的结合,提出了一个基于DOF的JND模型。利用视差信息将前景和背景有效的分离,分别对不同区域使用不同的量化参数,并且对亮度JND模型加入了高斯滤波器实现DOF效应,有效的将需要模糊化的背景区域的码率分配给了需要提高质量的前景区域。实验结果表明,该方法大幅度的消除了背景区域的冗余,节省了码率,并且提高了前景区域的质量,改善了视觉舒适度。
其他文献
近一段时期,在图像分析和模式识别领域的发展使感情和会话时的脸部信号的自动识别成为可能。自动化后的人脸表情识别可以被应用到人机交互方面,从而最为一种新的方式和手段从而
随着通信网络技术的飞速发展,特别是Internet的不断普及,人们的消费观念和整个商务系统都发生了巨大的变化,人们更希望通过网络的便利性来进行网络采购和交易,从而导致了电子
在“客户为向导”的时代,企业实施客户关系管理可以持续与消费者建立良好的互动关系,其经营策略是“卖客户真正需要的产品”。然而,不同的客户其需求各不相同的,只有发掘客户的潜
该文介绍了基于微机通讯的数字式应变仪的研究与设计。针对微弱信号在硬件选择上和软件方面采用相应方法来提高精度和抗干扰能力。采用RS232串行方式与上位机之间通讯,并且控
远程实验作为远程控制的一种应用,是计算机网络和多媒体技术相结合的新一代实验技术。利用远程实验,广大实验者可突破传统实验在实验资源(实验设备、场地和时间等)和实验方法(
该论文在充分考虑电力企业未来发展需求的基础上,运用管理信息系统开发的一般理论和软件开发的基本方法,介绍基于客户机/服务器结构的电厂管理信息系统的整体设计方案,详述设备
机器翻译是自然语言处理的重要应用领域.口语翻译作为机器翻译的一个新兴分支,具有重要的理论意义和实用价值,正受到越来越多的关注.该文以基于统计的翻译方法为研究主线,提
当今,国际上对足球机器人的研究以及相应的各种比赛取得了迅速的发展.足球机器人是一个交叉学科,并且足球机器人系统本身既是一个典型的多智能体系统,又是一个多机器人协作自
在目前知识经济时代,信息技术及信息服务业的迅速发展正在改变着商务领域的环境,传统的商务经营模式和管理方法己经不再适应新形势的发展.电子商务伴随着电子计算机网络的发