基于深度学习的视频帧内预测与环路滤波方法研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:Mos_Lei
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
未压缩的原始视频信号包含巨大的数据量,视频压缩技术的进步使得在有限的带宽中传送高质量视频成为可能。尽管现代视频编码技术已经具有极高的压缩效率,但随着互联网的兴起及超高清显示拍摄设备的普及,视频的数量和质量呈爆炸式增长,当前视频编解码标准的压缩效率仍然难以满足人们对高数量高质量视频的需求。另一方面,近些年在硬件强大的计算能力和互联网大量可获得的数据的支持下,深度学习展现出巨大潜力并在众多领域取得了重大突破。将深度学习应用于视频编码以提高编码效率也引起了领域内广泛关注并成为了学术研究前沿。
  基于此,本文主要研究了基于深度学习的视频编码技术,主要工作可分为四个部分:第一,全面地介绍了近些年基于深度学习的视频编码技术的研究现状,并按视频编码框架中的模块加以分类总结,其中着重介绍分析了基于深度学习的帧内预测和视频滤波算法;第二,本文给出了一种通用性极强的递归残差卷积网络,该网络结合了递归学习策略与残差学习策略,并可广泛用于各种图像增强和图像恢复任务。第三,鉴于传统帧内预测方法无法充分利用上下文信息且基于方向的线性预测器过于简单,提出了一种基于递归残差卷积网络的帧内预测方法,该网络将相邻重建块和传统预测块一起作为输入,学习传统预测块与原始块间的残差。网络的具体结构由三部分组成,对于不同大小的输入块仅需训练单个公共网络模型,该方法实现了亮度分量2.8%的编码效率提升。第四,提出了一种基于递归残差卷积神经网络的帧内预测帧环路滤波方法,该方法将量化参数信息添加至网络的输入,增强对不同质量压缩帧的辨识能力,训练好的单个模型可广泛处理不同质量的重建帧,可大幅提高滤波后视频的主客观质量,实现了亮度分量8.7%的编码效率提升。
其他文献
图匹配问题是多媒体领域中一个基本的问题,在目标检测、目标追踪、三维模型检索等领域都有重要的作用。本文提出了一种基于子图学习的图匹配算法,通过引入惩罚项来优化子图的选择,从而降低传统图匹配问题中离群点对匹配结果的影响,提高了匹配精度。  本文还基于子图学习的图匹配算法提出了基于图匹配的三维模型检索算法。本文对三维模型提取多个角度的二维视图,将三维模型检索的问题转换为图匹配的问题,然后利用子图学习的算
从军事、工业、农业到人工智能等多个领域,无人机得到越来越广泛的应用。在所有对无人机的应用研究中,任务分配和路径规划是最基本的两项技术。近年来,已经提出了多种任务分配和路径规划方法,并且取得了一定的进展。任务规划根据对应用场景的整体把控,对无人机作出合理的任务分配方案,帮助无人机更好地完成任务。路径规划则根据无人机到目标点的距离等因素为无人机规划出最佳的飞行路线。因此对任务分配和路径规划方法的研究对
学位
水声传感器网络作为探索海洋、开发海洋的一种新的方式,在海洋监测、临海预防等多个领域有着广泛的应用前景,已引起各国越来越多的关注。作为海洋监测的重要工具,水声传感器网络的核心是能够有效收集所需要的海洋环境信息。因此,本论文针对数据收集时的节点部署和路由关键技术展开研究。  针对现有节点部署方法未能很好实现网络覆盖和连通的联合优化,无法有效收集数据并传输的问题,本论文设计了一种基于深度可调节节点的部署
手写体中文的自动识别是中文文档数字化的前提和基础,在历史文档识别、手写笔记转录等方面有着重要的应用价值。手写体中文具有书写随意、结构复杂、相似性强、数目众多、缺乏统一规范等特点,这使得其自动识别成为一个具有挑战性的问题。  本文首先分析了手写体中文自动识别领域的研究背景与意义,对国内外的研究现状做了综述;介绍了深度学习的基础理论知识、卷积神经网络的构成,以及常用的网络模型。  其次,论文在经典Le
利用微多普勒雷达对人体行为进行识别,在灾后搜救、智能家居、无人驾驶、安全监控等领域都有广泛的应用,具有极大的研究价值。面向实际应用,本文开展了微多普勒雷达图像去噪和人体行为识别的研究,分别提出了去噪模型和人体行为识别模型,并利用雷达仿真数据和实测数据对所提模型的性能进行了评估,主要研究内容及创新性工作如下。  为了去除微多普勒雷达图像中的噪声,提出了一种基于生成对抗网络(Generative Ad
作为计算机视觉领域的基本问题之一,目标检测系统实现了对图像中每个目标对象的分类,同时在目标中心点四周绘制大小适当的边界框来对目标进行定位。目标检测任务是视频分析、场景理解等其他计算机视觉任务的重要基础。近年来,得益于深度学习技术的飞速发展,智能安防、自动驾驶等领域的研究进展迅速,新目标检测算法层出不穷。目标检测技术的突破使得对快速准确的目标检测系统的需求越来越多,诞生了系列算法。  虽然目标检测算
学位
图像质量是影响机器视觉决策的决定性因素。在工业检测场景下,由于环境光照、被测物体表面材质、反射率及三维形状等因素的影响,拍摄图像容易出现采光不同的现象,导致过曝光区域与曝光不足区域同时出现,这些区域一旦形成,无法通过图像处理的手段进行恢复。由于图像细节信息的丢失,影响了工业检测的准确性和可靠性。基于上述问题,本文提出了使用自适应照明系统,此系统主要思想是采用主动改善光照条件的方式进行自适应补光:在
学位
随着立体成像技术的发展,立体图像逐步走进人们的生活,但观看质量不好的立体图像会引起人们心理和生理上的不适,这严重限制了立体成像技术的发展,因此找到一种能够系统有效的评价立体图像质量的算法已成为了相关领域的研究热点。论文的主要工作如下:  第一,论文提出了一种基于自适应的融合图像与集成学习的立体图像评价算法。首先考虑到增益控制和增益增强等人眼视觉机制,模拟双目视觉信息在视觉通路中的融合过程,将立体图
随着计算机技术与硬件设备的发展,人体关节三维坐标数据逐渐获得学术界与工业界的重视,应用到很多领域,如在影视动画作品中驱动虚拟人物、在体育训练中记录测量数据、在网上购物中虚拟试衣、以及在游戏中体感交互等,逐渐渗透到人们的生活中。人体关节三维坐标数据通常由彩色图像或深度图像经由人体轮廓提取、虚拟骨骼曲线提取、二维关节点定位、相机校准等算法获得,获取到的数据由于运动复杂或存在遮挡、衣服纹理相似或材质柔软
学位
光电振荡器(optoelectronic oscillator, OEO)作为一种新型高性能振荡器,由于其具有高振荡频率、低相位噪声和高频谱纯度等特性,受到越来越多学者的关注和研究。随着OEO的相位噪声和边模抑制性能的不断完善,频率可调谐性成为了其实用化的阻碍,如何在保证低相位噪声和高边模抑制性能的同时产生频率可调谐的振荡信号成为了研究的热点。除了上述特性,OEO的振荡频率对于腔长变化特别敏感。利