基于深度学习的图像压缩方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:moli2146
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,随着拍照设备的不断升级,存储图片所需的内存空间飞速增长,然而硬盘、U盘等存储设备的容量却增长缓慢。不断增长的图片数据量与有限的存储容量之间的矛盾给图像压缩带来了巨大的挑战。深度学习已经在处理目标检测、跟踪、分类等诸多图像问题中取得了巨大突破,然而深度学习在图像压缩领域目前还并没有被充分研究。本文将利用深度学习在图像处理方面的优势,使用深度学习来提升图像压缩性能。本文首先设计了基于卷积神经网络的自编码器,包含图像编码网络和解码网络。编码时,将待压缩的图像输入网络,然后逐步降低图像的空间尺度和特征图数目,并通过量化将对于图像质量影响小的信息去除,从而达到数据压缩的目的。解码时,通过卷积和像素重排结构逐步将图像的尺度恢复,最终重构输入图像。本文在实验中详细对比了量化层、子像素卷积层等结构对压缩效果的影响,对深度网络在图像压缩领域的应用有重要指导意义。然后本文设计了卷积神经网络与JPEG结合的编解码框架。首先将待压缩的图片送入空域冗余去除结构,初步去除因图像局部相似而产生的信息冗余,然后使用JPEG编码,将图片变换到DCT域,通过量化去除对于图像质量影响较小的高频信息。当需要解码时,使用JPEG解码器将图像从DCT域变换到像素域,初步重构图像。由于编码时去除了图像的部分空域和频域信息,直接从JPEG解码器得到的图像视觉质量较差,本文在解码端添加了一个包含17层卷积层的神经网络,将图像在空域、频域的失真逐渐恢复,最终重构出了清晰的解码图像。此框架的创新点在于同时减少了图像在空域、频域的冗余,并通过卷积网络恢复了图像在空域、频域的失真,提高了图像的压缩比率,增加了重构图像的清晰度,最终实现了比传统压缩方法更高的图像压缩比率和视觉质量。相同码率下,由此框架生成的压缩图像,在视觉质量上比JPEG高约3DB。最后本文将前面提出的卷积神经网络和JPEG结合的框架拓展到了图像分类问题中,将分类网络与复原网络联合训练。最终使通过本框架生成的压缩图像,在分类性能与JPEG压缩图像的相近,重构图像的失真更小,压缩比率更高。
其他文献
近年来,流数据挖掘与管理成为学术界和工业界所共同关注的问题。随着skyline计算在多标准决策系统、城市导航系统、数据挖掘和可视化、智能防御系统、以及地理信息系统等领域
在计算机视觉的领域中,视频目标的跟踪有着重要的研究意义,视频目标跟踪的主要工作是在一段视频序列中寻找出与指定目标最相似的内容以检测、识别、提取和跟踪,通过分析获得
医用B超以超声波为载波,通过幅度调制与解调机制完成对人体生理组织的探测。传统B超由于电子技术水平的限制普遍采用模拟电子技术实现,但由于模拟线路自身干扰大、信号处理精
计算机网络的高速发展给网络管理带来了重大挑战。但是SNMP协议在网络配置,传输效率,安全性,告警管理等方面仍然存在根本性的缺点。而基于XML的NETCONF协议具有强大的配置功
随着信息技术的发展,资产密集型企业的设备功能不断增强,构成更加复杂,自动化_、系统化程度越来越高,相应的维护与管理更加困难,从而给企业设备管理工作带来许多新的问题,严
Hadoop是目前最流行的大数据存储与计算平台,具有廉价,稳定,易扩展等特点。尽管Hadoop应用很广,Hadoop的错误与故障诊断却仍然依靠人的经验。实际上错误与故障信息就隐藏在日
水泥基材料作为主要的基本建设原材料之一,在工业、农业、交通、城市建设、水利以及海洋开发等工程建设中有着广泛的应用,在经济社会的发展中占有突出的地位。同时,也越来越显示出水泥制品在代钢代木方面的优越性。因此,水泥基材料性能的提高对于促进国民经济和保证国家建设意义重大。而水泥的微观结构对水泥的性能和性质有着巨大的影响,因此对水泥微观结构的研究在提高水泥性能方面有着极其重要的作用。随着计算机科学技术的进
从上世纪五十年代软件诞生开始,软件设计一直是软件系统开发的核心内容,好的软件设计有助于软件开发人员提高工作效率,减少不必要的开支以及保证软件的正确性。但采用何种方法来
进化算法是模仿生物自然进化过程的一种随机搜索方法,最初具有三大分支:遗传算法、进化规划和进化策略。九十年代初美国学者Koza在遗传算法的基础上提出了一种全新的结构描述
随着计算机技术和网络技术在虚拟仪器领域的不断深入,网络化已成为虚拟仪器技术发展的一个重要方向。同时复杂的测试任务对测试系统提出了新的需求,基于网络的、可配置的、分布