基于立体视觉感知模型的码率控制算法研究

来源 :宁波大学 | 被引量 : 0次 | 上传用户：dyoyo90

【摘要】

：

与传统的视频编码相比，感知编码能够节省码率的同时获得更好的视觉感知体验，具有非常大的发展空间。然而，现有的感知模型众多且复杂度高，提出更符合人眼特征的感知模型，以及如何在

【作者】

：

徐升阳

【机构】

：

宁波大学

【出处】

：

宁波大学

【发表日期】

：

2016年期

【关键词】

：

立体视觉人眼感知码率控制视频编码

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

与传统的视频编码相比，感知编码能够节省码率的同时获得更好的视觉感知体验，具有非常大的发展空间。然而，现有的感知模型众多且复杂度高，提出更符合人眼特征的感知模型，以及如何在编码过程中高效利用感知模型，成为感知编码研究的关键问题。为此，本学位论文分析了现有人眼感知模型以及人眼视觉特性，从人眼视觉感知冗余的角度出发，展开人眼感知模型探究及其在视频编码中应用的研究工作。　　针对高效视频编码(High Efficiency Video Coding，HEVC)中的码率控制(Rate Control，RC)对于场景突变的序列存在重建视频质量波动大，参数更新不及时等现象。本文提出了一种面向 H E V C图像组（Group of Picture，GOP)级的R C优化算法。首先，统计分析了 GOP内首尾帧差变化情况，用来检测不连续变化的场景；然后，研究每个 GOP分配的比特数与 GOP内帧变化剧烈程度之间的相关性，建立码率分配模型；最后，考虑不连续变化的场景切换对 RC参数更新的影响，以提高 RC的精准性。实验结果表明，在基本不增加复杂度的情况下，本文提出的RC优化方法对于场景突变序列比 HEVC标准算法 PSNR波动减小，且总体率失真性能提升。　　考虑目前的恰可察觉失真(Just-Noticeable Distortion，JND)模型在编码应用中的不合理因素，本文提出了面向 H E V C的恰可察觉编码失真（Just Noticeable Coding Distortion，JNCD)模型。首先，分别设计了主观实验研究恰可察觉梯度幅值差异(Just Noticeable Gradient difference，JNGD)的变化规律以及梯度幅值和背景亮度对恰可察觉编码失真阈值的关系，通过统计分析分别建立 JNGD模型和梯度幅值与背景亮度相关的恰可察觉编码失真阈值关系。然后，使用 JNGD模型滤除自然图像通过变差分（Total Variation，TV)分解后的结构图和纹理图中人眼不可察觉的梯度幅值。最后，通过对滤波后图像的分析判别，将原始图像划分为边缘、平坦、纹理三类区域，并分别结合恰可察觉编码失真阈值关系形成自然图像的JNCD模型，最后在HEVC标准测试平台上验证了该模型的可靠性。　　立体视频观看时存在掩蔽效应，可以用来指导立体视频编码的非对称编码，从而为传输过程节省大量码率。为此，本文分别设计了主观实验，定量研究视差和梯度幅值对立体掩蔽阈值的影响，通过统计分析得到对应的关系模型。同时，本文结合现有的纹理关于立体掩蔽阈值模型以及帧间编码特性，建立立体视频的双目恰可察觉编码失真（Binocular Just Noticeable Coding Distortion，BJNCD)模型，并且在MV-HEVC标准测试平台上验证了 B J N C D模型的可靠性。同时，利用本文提出的B J N C D模型指导两视点MV-HEVC的非对称编码。与原始平台相比，本论文方法在相同的立体主观感知质量下，辅视点码率平均节省11.41％。并且本文的BJNCD模型更适用于高码率情况，能够为高清、超高清等应用节省大量码率。

其他文献

基于HMM的情感语音识别

随着计算机的普及以及计算机科学技术的迅猛发展,人类对计算机的依赖性不断增强,一场信息革命正在酝酿,新型的人机交互技术正逐渐成为研究热点。语言本身作为人类特有的功能,

学位

语音信号处理情感语音库情感特征提取隐马尔可夫模型

高校共青团服务大学生创新创业能力的途径探究

随着社会人才需求的变化,我国高校在培养大学生过程中,学生创新创业能力的培养越来越受关注,文章从多角度针对大学生创新创业能力的培养进行了分析,提出了合理化的建议.本文

期刊

高校共青团工作大学生创新创业能力

10G EPON物理层的设计与实现

本文主要阐述了基于FPGA的10G EPON物理层的设计与实现。首先介绍了以太网技术、接入技术的发展历程以及10G EPON系统的工作原理和相关理论知识,随后介绍了ESL建模在整个系统

学位

10G EPON物理层前向纠错FPGA

并扩超宽带通信系统的调制解调方法及性能研究

随着通信技术的不断发展，现代通信系统对通信的有效性和可靠性提出了更高的要求，如何有效提高这两项相互矛盾又相互制约的性能指标，一直都是通信领域的研究热点，并且通信系统的安

学位

并扩超宽带通信系统调制解调串行接收并扩信号信道适应技术

OFDMA中继通信系统资源分配研究

移动互联网的快速发展极大地刺激了人们对无线通信高数据速率和多业务服务的需求。然而无线频谱资源非常稀缺，因此提高其利用率是无线通信研究的重要内容之一。正交频分复用（Or

学位

正交频分多址多输入多输出中继通信资源分配分集增益

基于稀疏分解的音符识别研究

音乐是人们日常生活的重要组成部分,可谓是人类精神生活的润滑剂,从古至今音乐的熏陶与鼓舞从未间断。分析音乐信号对研究音乐有积极的促进作用,而音乐信号音符识别在自动音

学位

匹配跟踪基追踪多分辨率分析人耳频率特性音色特征

面向Web的农业轻量级本体学习研究

我们正处在一个知识爆炸的时代。然而不同领域、不同性质、不同目的的知识以及不同的知识表示方法和推理机制，使得知识之间难以进行共享和互操作，人们仍然只能望洋兴叹。因此，人

学位

轻量级本体农业本体学习领域术语抽取概念层次树语义Web智能信息检索

拉曼型光纤温度传感系统信号处理的研究与实现

分布式光纤温度传感技术是一种用于实时测量空间温度分布的高新技术,是目前传感领域研究的一个热点。本文综述了分布式光纤温度传感技术的研究现状,深入研究了拉曼散射的基本

学位

拉曼散射光纤传感信号采集与处理小波模极大值

基于内容的三维视频立体化及舒适度增强方法研究

立体视频技术给观众带来的不仅仅是图像质量的提升，而是一种全新的视觉体验，但是目前一方面随着分辨率的提高，视频编码复杂度急剧增加，另一方面立体视频技术的视觉舒适度问题也限

学位

立体视频视频快速编码视觉舒适度深度感知图像增强

茯苓配方对功能性消化不良调节作用的研究进展

茯苓Poria cocos(Schw.)Wolf.是中国传统药材,中药茯苓不仅具有利水渗湿、健脾和胃、养心安神的功效,同时在对功能性消化不良患者的治疗中,茯苓配方如茯苓甘草汤、参苓白术散

期刊

功能性消化不良茯苓配伍

基于立体视觉感知模型的码率控制算法研究

与本文相关的学术论文