基于深度卷积神经网络的图像压缩方法研究

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:chenliquanhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着摄像头的不断更新换代,图像的分辨率越来越高,所占空间也越来越大,为图像的存储和传输带来了巨大的挑战。除了考虑增加存储空间、升级带宽外,还应该从图像本身出发,研究图像压缩技术,在保证图像质量的情况下,尽量减少存储空间。基于深度学习的图像压缩方法近几年发展迅速,其中基于卷积神经网络的方法已经成为主流的压缩方法。该类方法主要分为四部分:编码器、量化器、熵编码器以及解码器。编码器采用卷积层提取图像特征,学习紧凑表示。中间特征经过量化器和熵编码器后形成比特流用于存储和传输。解码器采用卷积层恢复图像信息,损失函数采用率失真函数进行优化。高光谱图像是一种新型的遥感图像,蕴含丰富的空间、光谱、辐射信息,在地质监测、环境保护、海洋气象探测、资源普查等方面运用十分广泛。但是高光谱图像数据量大,给图像的传输和存储带来巨大挑战。因此,对高光谱图像的压缩也十分重要。许多高光谱图像压缩方法已被提出,但是目前尚未有基于深度学习的高光谱图像有损压缩的相关工作。鉴于以上问题,本文基于卷积神经网络,研究了自然图像以及高光谱图像的有损压缩方法,主要工作如下:1.提出了基于对偶Squeeze-and-Excitation(SE)模块的卷积神经网络图像压缩方法。考虑到自然图像深度压缩框架中存在的特征图数量多且相关性强这一特点,该算法结合通道注意力机制,设计了对偶SE模块。在编码器使用SE模块(SEblock),针对不同的特征图学习不同的权重响应,改善了特征图的分布,进一步提高熵编码的压缩率;在解码器中使用反向SEblock(ISEblock),采用按通道相除权重来补充丢失的图像细节信息。该算法在标准测试集Kodak数据集上与Ballè’s,JPEG,JPEG2000和WebP四种方法进行比较,在低比特率下保留了更多的图像纹理和而细节部分,视觉质量得到明显改善。2.提出了基于端到端残差卷积网络的高光谱图像压缩方法。该算法考虑到高光谱图像数据空谱相关性强,数据量大且训练难度高,所以采用全卷积网络结合残差层的方式组成编码器和解码器。将高光谱图像以三维张量的形式整体输入到网络,编码器交替使用卷积层和残差层,保留光谱信息的同时有重合地提取空谱融合特征,同时降低特征图的空间维度。解码器交替使用反卷积层、残差层以及Subpixel层,恢复图像的空间信息和光谱信息。该算法训练集与测试集均来自CAVE数据集,并与两种传统方法JPEG和JPEG2000进行比较,实验结果显示该算法在低比特率下恢复的图像质量更高,光谱信息更加完善,对高光谱图像压缩具有较好的处理效果。3.提出了基于空谱联合深度卷积网络的高光谱图像压缩方法。该算法考虑到高光谱图像数据不仅要去除空间冗余,还要考虑波段之间的相关性,于是利用深度框架分步压缩光谱和空间信息。首先使用1×1卷积核对光谱信息进行压缩,然后再利用大卷积核提取空间特征,并降低特征图的空间维度。在解码器对称使用1×1反卷积结构恢复被压缩的光谱信息。该方法分别与JPEG、JPEG2000以及本文提出的基于端到端残差卷积网络的高光谱图像压缩方法进行比较,在PSNR和MS-SSIM上均有显著提高。
其他文献
作为自动装填系统中的关键部件,弹丸协调臂的回转速度和到位精度影响着装填系统的可靠性、火炮的射击速度和射击精度,但是在运行过程中系统参数的非线性变化、液压系统的固有特性等因素对弹丸协调臂的位置控制带来一定的难度,因此对弹丸协调臂的精确位置控制研究具有实际工程意义。本文主要包括以下几个方面的研究内容:(1)详细介绍了弹丸协调臂的基本组成和工作流程,并提出工作过程中需要满足的精度要求。结合弹丸协调臂的机
基于深度学习的小样本学习希望深度网络在含有大量标注的基本类样本上预训练后,使得网络在遇到只有少量标注的新类别样本时,能够实现对这些新类别的快速泛化识别。当前实现小样本学习的一个主流方法是元学习(Meta-Learning)。然而,基于元学习的方法不仅需要大量的训练时间和计算资源,而且性能也无法令人满意。近期,基于传统监督表示学习的小样本学习方法被证明能够取得和元学习方法相媲美的结果,且拥有模型结构
随着信息化技术在传统制造业的快速发展与应用,对数据资源合理利用的需求日益增长。离散制造设备作为数据资源的来源,在离散制造的发展方向中扮演着重要的角色,因此研究基于离散制造设备的物联系统,实现对数据的利用与整合具有重要的意义。本文主要以五洋纺机有限公司数字工厂为应用场景,以FANUC-0i/30i和海德汉i TNC530系统的机床与加工中心为对象进行了研究。首先,根据离散制造设备物联系统对数据实时预
本文是以C形龙门三平动并联机构和C-A型双摆头构成的五轴联动混联机床为研究对象,针对该机床的运动学分析、轨迹插补、速度控制及冗余滑块位置规划等关键技术进行了重点研究。主要内容如下:首先进行了机床运动学分析。根据五轴联动混联机床的结构特点和运动关系,推导出机床的位置反解方程、位置正解表达式、并联机构的速度逆雅克比矩阵及加速度映射关系,简单解释了机构正解的多解性及定解方法。其次,针对混联机床的运动关系
本文以定深电液伺服控制系统的应用为背景,以优化系统在复杂工作环境下的稳定性为目标,重点针对定深电液伺服系统内部参数的摄动、不确定性,以及控制系统对外部负载扰动的抗干扰性问题,开展了基于神经网络的PID控制策略以及滑模变结构控制策略研究。本文首先分析了定深电液伺服系统的结构及工作原理,对其中重要的机械元件进行选型介绍。在此基础上分析了系统的动态特性并构建其数学模型。此外还将对定深电液伺服系统控制性能
随着空中和地面移动机器人的深入研究,促进了具有多种运动能力的多栖机器人的发展。陆空两栖机器人作为多栖机器人的一个重要分支具有空中和地面两种运动能力。陆空两栖机器人自主运动时,需要为机器人规划出一条从起点到目标点无碰撞的三维路径。同时在运动过程中,陆空两栖机器人需要根据当前的环境信息自主决策选择较优的运动模式。因此,以复杂环境下陆空两栖机器人为研究对象,开展了针对环境建模、路径规划算法以及切换决策算
目前,虚拟演播室已经成为当下节目制作的主流技术,而摄影机器人作为虚拟演播室的主要组成部分之一,也成为了机器人项目中的热门研究对象。本文针对虚拟演播室摄影机器人进行研究,对摄影机器人进行了结构设计、仿真分析、实验优化等方面的研究。在结构设计方面,根据设计方案对摄影机器人各个关键部件进行设计。针对电控云台的设计要求,完成了云台的结构设计,并进行了内部减速器的设计及选型;基于平行四边形原理对摇臂部件进行
磁电复合材料作为一种新型智能材料,具备磁电转换能力,能够直接感知外部磁场,在磁电传感器与换能器领域具有广阔的应用前景。非晶态磁致伸缩合金在数十奥斯特的磁场作用下就会发生饱和磁化,产生非线性磁致伸缩效应,从而非晶态合金/压电复合材料在较高幅度的激励磁场作用下产生非线性磁电效应。现有研究表明:通过解调奇次谐波输出,可实现静态/低频动态磁场的测量,且无需另外施加偏置磁场。本文从理论和实验两个方面对非晶态
本课题来源于企事业委托项目,负责研发虚拟演播室摄影机器人的视觉模块,主要实现摄影机器人对目标主持人的识别与跟踪的系统开发,其核心模块主要有人脸识别模块、深度定位模块与目标跟踪模块。本文首先对虚拟演播室下摄影机器人的工作空间需求进行分析,提出了一种轨道式摄影机器人,并对其结构与控制系统进行了详细介绍。本文对该摄影机器人进行了运动学分析,并对其进行了逆运动学求解。虚拟演播室下,除主持人固定外,其他嘉宾
滚珠丝杠副作为数控机床的核心传动部件,其性能直接影响数控机床的定位与传动精度。经过多年可靠性工程的研究,国内滚珠丝杠副的综合性能已经获得了极大的提升。而作为可靠性工程的重要组成部分,滚珠丝杠副的可靠性增长承担着设计加工优化改良,现场使用规范操作的任务,而目前对这方面还鲜有研究。本文依托国家科技重大专项,旨在建立与验证一个适用于不同型号丝杠的可靠性增长体系与评估方法。本文首先建立了滚珠丝杠副可靠性增