基于纹理及JND建模的视频编解码研究

来源 :武汉大学 | 被引量 : 5次 | 上传用户:lw_hualei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前典型的通用视频编码标准采用基于预测、变换架构的混合编码技术框架,其基本原理建立在香农信息论基础之上,压缩思想仍停留在数字信号处理的层面,主要从去除数据冗余角度入手,编码效率的提高主要依赖于以运算复杂度大幅增加为代价的技术细节的微调。随着视频编码技术的发展,目前基于香农信息论的视频编码技术面临着较大的发展瓶颈,以提高计算复杂度来提升压缩效率的改进思路的发展空间越来越小。如何进一步高效率的提升压缩效率成为视频编码领域一个亟待解决的问题。视觉感知编码从图像内容的角度出发、基于人眼视觉理论来指导视频压缩,在保持图像主观感知效果基本不变的条件下能极大降低码率,对于解决这一难题具有重要意义。本文首先对视觉感知编码中的典型代表技术纹理合成、JND建模技术进行综述分析,并以其为核心具体从视频编码的时域预测技术、“隐含运动估计”的帧间预测技术、基于JND模型的编码技术三个方面进行综述并得出结论:由于人类对视觉感知机理认识的不足,完全从人眼视觉系统HVS出发探索新编码途径的工作仍然进展缓慢,存在不少不足之处。但是基于局部视觉特征、将某些较为成熟的视觉合成技术无缝引入到传统视频编码框架内,不仅在一定程度避免了单纯基于视觉特征编码技术面临的难点,还能突破现有视频标准依靠提升计算复杂度来改进压缩效率的传统思路。基于以上分析,本文在国家自然科学基金青年基金项目“基于纹理建模的预测编码技术研究”(No.61003184)、国家自然科学基金面上项目“基于反向纹理合成的视频编码技术研究”(No.60970160)和微软亚洲研究院创新计划项目“基于Contourlet变换和图像结构信息的JND模型”(No. FY09-RES-OPP-013)的资助下,对视觉编码领域中的纹理建模和JND建模技术展开研究,提出了兼容传统混合视频编码框架的纹理合成、JND建模编码方案,形成了基于视觉特性的改进编码算法,提高了视频编码效率,具有较高的理论价值。对于满足高清视频应用中提升压缩效率的需求和宽带移动环境下提升视频容错能力的需求而言,具有重要的应用价值。具体来讲,本论文的主要研究成果如下:(1)基于动态纹理模型的视频编/解码算法传统动态纹理模型求解方法采用前面若干帧图像的平均值作为合成图像的基准值,使得合成的虚拟帧表现的是一段时间内图像的整体运动趋势。该方法合成的图像虽然主观效果较好,但是由于合成图像与当前待预测帧的相关性较低,降低了帧间预测效率。虽然有学者提出了改进的求解方法,但是为了保证编/解码端的数据匹配而省略噪声项,使得动态纹理模型没有了噪声驱动项,理论上导致模型无法驱动。针对这一问题,本文提出一种改进的动态纹理模型求解方法,通过引入伪随机函数作为模型驱动项,采用逐帧更新迭代的方法使得合成的虚拟帧具有更小的图像合成误差值。在此基础上,在编码端提出一种虚拟帧算法,改善了现有多参考帧预测技术对于非线性运动、背景光照变化时预测效率不高的影响;在解码端提出一种帧级错误掩盖方法,改善了整帧丢失情况下传统错误掩盖算法对于复杂运动场景恢复效果不佳的影响。(2)基于STALL模型的帧间预测算法原始STALL纹理模型以像素点为基本处理单元、形成逐点合成的处理框架,而现有视频编码标准采用基于块的处理框架(如H.264标准以4×4块为最小处理单元)。将STALL模型用在基于块为最小处理单元的视频标准有损压缩时,由于空域邻居点无法实时获取到,只能利用时域邻居点信息来建模,降低了模型预测精度。针对这一问题,本文提出以4×4块为处理单元的时、空邻居点自适应选择方法,建立适合视频有损压缩的改进STALL模型,提出了一种新的帧间预测模式,提高了帧间预测的预测精度。(3)基于彩色JND模型的残差自适应滤波算法传统彩色JND模型的建模方法通常基于RGB、YCbCr等色彩空间,由于这些色彩空间不是均匀色差系统,不具有进行彩色图像分析与处理所需的独立性和均匀性指标,使得在计算色度JND阈值时的精度有待提高。针对这一问题,本文基于均匀色差空间CIELAB彩色系统,提出对应的彩色JND模型建模方法,使得该JND模型在色度分量上能更准确的表征人眼感知特性,具有更好的感知峰值信噪比,进而将其应用到视频编码中的自适应残差系数滤波模块中,在主观质量基本相同的条件下进一步提高了编码的压缩效率。综上所述,本文基于纹理及JND建模理论建立一套高效视频编码框架,突破传统视频编码技术单纯以提升计算复杂度来提高压缩效率的局限,提出了一套兼容传统混合视频编码框架的增强编码工具集,具有较为重要的理论意义和应用价值。在此基础上,本文最后总结了相关研究成果的创新之处,并基于多视点视频编码、视频质量评估这两个方面进行了下一步的研究展望,期望结合已取得的研究成果在基于纹理合成的多视点视频编码、基于视觉特性的视频质量评估这两个方面进行进一步的探索。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
自古以来,阴阳相生,万物平衡,人类与自然和谐共存近百万年。然而,大约自18世纪中期的西方工业革命起,人类开始无节制地掠夺自然;20世纪中后期,在科技与经济比肩猛进的势头下,
为研究以一种新型活性酵母为主要成分的微生态制剂在模拟动物胃肠道环境下的耐受情况,运用直接计数法对酵母菌在一定时间内的生长曲线、pH值变化以及凝聚性进行测定,分析该活
建立血清S-100ao蛋白测定方法并探讨其在心肌疾病中的应用。方法 以S-100ao蛋白纯品免疫家兔,得抗S-100ao蛋白抗体,用双抗体夹心酶联免疫吸附测定血清S-100ao蛋白。结果 方法线性可达10μg/l,批内变异为5.4%,批间变异
如果以“反物质主义”或是环保的名义,让人们放弃追逐最潮流的设计,除了会招致产品制造商、时尚界的抵制,恐个白也只能起到一时的效果。那么,时尚与绿色真是鱼与熊掌难以兼得吗?海
B超、CT广泛用于临床肝胆系统的影像学诊断,其简单、方便、无损伤,明显提高了对肝胆系统疾病的诊断水平。但肝内胆管结石与肝内钙化在B超或CT的影像表现相似,容易混淆。结合我院肝胆外
将价格不菲的500支颜色不同并各具特色名字的铅笔,在20个月内分批邮售给会员,是个疯狂而超出商业惯有逻辑与思维的怪诞举动。1992年为纪念哥伦布发现美洲大陆500周年,一家名为芬
随着信息通信需求的增多和互联网技术的不断发展,海量数据业务的传送需求对光纤通信网络提出了更大的挑战。光传送网向透明(transparent) WDM网络逐步演进,以降低网络建设及
在自主着陆、自主导航等应用领域,需要掌握飞行器正前方区域的地形地貌及目标情况,解决长期困扰雷达正前视高分辨成像的技术难题。双基地合成孔径雷达(SAR),通过收发平台分置