数据驱动型高效视频编码算法研究

来源 :上海大学 | 被引量 : 0次 | 上传用户:lt13770509399
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频业务的不断发展,高效的视频编解码方法逐渐成为研究热点。新一代的视频编解码标准(High Efficiency Video Coding,HEVC)由于具有较高的压缩效率,并且对不同分辨率和不同格式视频都有良好的支持,逐渐成为目前的主流标准。HEVC沿用了以往的混合编码框架,内部的预测和增强等步骤均由传统算法完成。这些算法虽然具有较低的复杂度,却不能很好地适应如今日益丰富的视频内容,使得HEVC编码性能受限。为了进一步提高HEVC编码效率,本文结合视频编解码的特性,提出了基于数据驱动的高效视频压缩算法,主要研究内容如下:1)提出基于多尺度融合的HEVC环内滤波算法。由于HEVC采用基于编码单元的四叉树块划分结构,其产生的压缩失真具有多尺度相似性。此外,由于视频编解码对于实时性要求较高,因此滤波算法应该具有较低的模型和时间复杂度。基于这两点,本文提出了基于多尺度融合的HEVC环内滤波算法。首先,利用循环残差结构来更好地捕捉具有多尺度相似性的压缩失真。接着,在保证环内滤波性能的同时,采用共享卷积层参数的方式来有效地降低模型复杂度。实验结果表明,相较于HEVC的默认环路滤波器,本算法在All Intra,Low-Delay P以及Low-Delay B压缩配置下分别具有6.7%,7.8%和7.6%的BD-rate降低。2)提出基于多任务的HEVC插值算法。为了提高运动矢量精度进而降低预测残差,HEVC采用多抽头插值滤波器来预测分数位置像素。由于待插值帧经由编解码重建而来,其具有不可避免的噪声损失。因此,HEVC内的插值算法应额外考虑待插值帧的噪声特性,避免将噪声传播至插值像素,从而影响预测精度。基于此,本文提出了基于多任务的HEVC插值算法。该算法首先利用多任务学习的方式捕捉待插值帧的失真特性,为后续插值过程提供噪声的先验知识。随后采用反卷积结构统一生成不同分数位置的插值像素,有效地降低算法复杂度。实验结果表明,相较于HEVC的默认插值滤波器,本算法在Low-Delay P,Low-Delay B以及Random Access压缩配置下,分别具有5.1%,4.2%以及1.8%的BD-rate降低。3)提出基于特征非对称融合的视频帧盲增强算法。不同量化参数下的压缩视频仍采用相似的编码结构和预测模式,因此不同量化参数下的压缩失真同样具有特征相似性。实验表明,欠增强(利用低量化参数训练得到的网络来增强高量化参数编码的视频)的增强性能要优于过增强(利用高量化参数训练得到的网络增强低量化参数编码的视频)。基于这两个增强特性,本文提出了视频帧盲增强算法。首先,采用渐进式特征提取结构统一提取不同量化参数下的增强特征。接着,利用过增强和欠增强的不同特性对不同量化参数下的增强特征进行非对称融合,从而实现最优的盲增强性能。实验证明,该盲增强方法在不同压缩配置以及不同量化参数下均有超过0.5d B的PSNR提升。
其他文献
随着互联网技术的迅速发展,用户获取信息的方式逐渐增多,信息的易获取性给生活带来了便利,也带来了困扰。大量的信息冗余会影响用户对所需信息的选择,使用户难以找到自己感兴趣的项目,从而导致信息过载的问题。推荐系统正是为了解决这种问题而出现的新技术,推荐系统可以根据用户的喜好,为用户筛选他们所需的信息、物品、服务等。推荐算法是推荐系统的核心,其中协同过滤是目前应用最广泛的推荐算法,但由于其对用户外在行为信
论文依托于“重载铁路车地安全状态监测示范验证”的科研项目,开展列车走行部三维点云重建方法的研究。具体工作内容如下:(1)进行了列车走行部模型三维点云数据的结构光采集方案和相关算法研究。设计了三维点云数据采集平台,进行了相机参数标定与光平面参数标定。改进了激光条纹中心线提取算法,通过引入权重函数,对几何中心法与细化法获取的激光条纹中心线进行加权处理。(2)进行了三维点云数据的预处理。分析了噪声点云数
随着我国科学技术的不断进步以及社会经济的高速发展,对于传统基础建设行业的工业化、信息化及智能化生产将提出更进一步的要求。现如今,BIM技术在我国得到大力推广,BIM作为一项新的技术,在我国建筑领域的应用已经取得了巨大的进展,许多BIM项目的成功落地证明了BIM技术具备长远的发展潜质。桥梁工程作为建筑行业一个重要分支板块,必须跟上时代的发展步伐,从而实现工业化、信息化、智能化的目标。如今,很多桥梁建
在经济新常态的市场发展环境,已经能够实现上市公司股份的大规模流通。以上市公司股份为标的的收购行为、手段、目的也随之不断变化。上市公司通过决议在章程中设置反收购条款,因其事前性、自治性、灵活性,是博弈的利益主体的自发应对,是对法律和监管的弥补,是新常态下适应市场调节规律的体现。国家通过市场化、法制化的手段大力推行公司并购重组,实现供给侧结构调整的经济政策,检视我国上市公司章程反收购条款制定的优化方向
本文主要研究排除妨害请求权的构成要件问题,范围限缩于物权受侵害。首先在明确各构成要件前,应当解决物权法中的排除妨害,与作为侵权救济方式的排除妨碍之适用冲突问题。基于我国《物权法》与《侵权责任法》均规定了排除妨害,该种模糊规定带来了适用问题。文章根据我国《侵权责任法》的特点以及《民法典(草案)》在过错侵权中明确“造成损害”的要件,参考比较法上的一般化趋势,指出二者均不以过错为要件。但为防止《物权法》
目的:探究二甲双胍发挥降糖作用与小鼠肠道菌群的相关性,以及用药后小鼠生理活性改变情况,以指导临床用药。方法:实验选取8周龄的C57BL/6J小鼠96只,分为正常小鼠对照组(N)、
在上个世纪八十年代,中国的雕塑艺术家在发展过程中曾持续面临着双方面的挑战:一方面是本土艺术的发展体系,另一方面是面对西方二战后的雕塑发展所带来的参照与挑战。这样的双重参照体系互相交错、媾和。面对这样的局面,雕塑艺术家们的发展呈现出两种路线:一种以反传统为核心的艺术语言探索派,另一种是以中华传统文化为基础的当代语境转换派。雕塑家傅中望就属于后者,且是这一派为数不多的、卓有成效的探索者,其作品极具代表
目的:(1)将治疗前后的难治性面瘫患者和普通周围性面瘫患者的临床量表评分结果进行比较,探讨针灸治疗难治性面瘫的临床疗效,以期为临床治疗该病提供行而有效的诊治方案。(2)
在经济全球化与智能船舶快速发展的背景下,远洋船舶运输在国际贸易中占据的比例越来越高。另外,通信技术是研究与开发智能船舶的关键技术之一,因此通信系统的性能将直接影响着整个船舶控制系统的性能。为了提高海上运输的效率,保障船员与货物的安全,为增强船舶横摇稳定性,本文基于CAN总线进行了舵鳍联合减摇控制的相关研究。以工程应用为基础,设计了基于闭环增益成形算法的减摇鳍控制器与舵鳍联合减摇控制器。通过李雅普诺
目的:探讨成年女性正畸患者对唇侧、隐形和舌侧矫治器接受度的差异,及其与人格特征的关系。方法:选取20-39岁使用唇侧矫治器、隐形矫治器和舌侧矫治器的成年女性正畸患者各50