图像和视频的深度压缩感知

来源 :哈尔滨工业大学 | 被引量 : 3次 | 上传用户:wysaccp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
压缩感知(compressed sensing,CS)理论为信号采集和重建提供了一种新的模式,其同时实现了信号的采样和压缩过程。具体地,CS理论表明,当信号在某个域中是稀疏的,则可以从比奈奎斯特-香农采样定理所要求的更少的测量值中正确地恢复原来的信号。CS理论从提出开始就一直是研究的热点问题,并且已经给信号处理和通信领域带来了巨大的变革。经过十多年的发展,CS技术得到了进一步的完善,如分布式CS和贝叶斯CS等相继被提出。CS技术也在许多领域得到应用,如磁共振成像和无线广播等领域。然而,CS虽然从理论和应用方面都得到了巨大的发展,但是这几年CS的研究出现了瓶颈。传统的基于稀疏正则模型的CS重建方法要么信号重建质量差,要么具有较高的计算复杂度。因此,研究低复杂度但高重建质量的CS方法是一个迫切的任务。近年来,深度学习在各个领域都取得了突破性的应用,并且能够以较低的计算复杂度获得较好的性能。本文使用深度学习来解决CS研究中的若干挑战性问题,提出图像和视频的深度压缩感知(称之为Deep CS)方法。具体而言,本文主要包括以下四个方面的工作:(1)提出了一种基于卷积神经网络的图像压缩感知框架(称之为CSNet)。CS研究中关注的两个挑战性问题分别是采样矩阵的设计和信号重建方法。一方面,常用的随机采样矩阵与信号无关,忽略了信号的特性。另一方面,主流的图像CS方法虽然取得了很好的重建性能,但却有较高的计算复杂度。为了解决这两个问题,CSNet联合地优化一个采样网络和一个重建网络。其中,采样网络自适应地从训练图像中学习一个采样矩阵,其使得采集到的CS测量值保留更多的图像结构化信息,从而可以更好地进行图像重建。具体地,本文提出学习三种类型的采样矩阵,即浮点矩阵、{0,1}-二值矩阵和{-1,+1}-两极矩阵。后两种采样矩阵是专门为便于存储和硬件实现而设计的。重建网络包括一个线性初始重建网络和一个非线性深度重建网络,其学习一个CS测量值到重建图像之间的端到端映射。实验结果表明,CSNet提供了领先的图像重建质量,同时能够实现快速运行。此外,CSNet使用学习得到的{0,1}-二值矩阵和{-1,+1}-两极矩阵作为采样矩阵依然能够获得与现有的基于深度学习的使用浮点采样矩阵的图像CS方法相当的图像重建质量,并且优于传统图像CS方法使用浮点采样矩阵获得的图像重建质量。另外,实验结果进一步表明,学习得到的采样矩阵能够显著地改进传统的图像CS方法的重建图像质量。(2)提出了一种应用于图像压缩感知的可伸缩卷积神经网络(称之为SCSNet)。SCSNet是CSNet的可伸缩拓展版本,其只需要训练一个模型就可以实现任意采样率下的可伸缩图像采样和重建。特别地,SCSNet同时提供了粗粒度和细粒度的可伸缩性。为了获得粗粒度的可伸缩性,SCSNet被设计为一个单一的采样矩阵加上一个层次化的重建网络。SCSNet的重建网络包含一个基本重建层和多个增强重建层。基本重建层提供基本的图像重建质量,而增强重建层参考较低的重建层并逐步提高图像重建质量。为了获得细粒度的可伸缩性,SCSNet采用贪婪方法选择测量基,从而实现任意采样率的图像采样和重建。与现有的基于深度学习的图像CS方法相比,SCSNet只需要一个模型就可以实现任意采样率下的可伸缩采样和高质量的可伸缩重建。实验结果表明,SCSNet在保持与现有的基于深度学习的图像CS方法相当的运行速度的同时,具有领先的图像重建质量。(3)提出了一种适用于彩色图像压缩感知成像的可迭代卷积神经网络(称之为ICSNet)。ICSNet联合地学习一个稀疏采样矩阵和一个可迭代的多通道联合重建网络。学习得到的稀疏采样矩阵既减少了计算量和存储空间又使得ICSNet能够更好地适用于彩色图像压缩感知成像。可迭代的重建网络进行多通道联合重建,有效地利用彩色图像通道间的相关信息,提高了重建图像的质量。ICSNet是一个轻量级的迭代网络,通过训练得到的迭代器的多次迭代,可以显著地提高重建图像的质量。实验结果表明,ICSNet在保持与现有的基于深度学习的图像CS方法运行速度相当的同时,具有领先的图像重建质量。(4)提出了一种基于卷积神经网络的视频压缩感知框架(称之为VCSNet)。VCSNet是前三个工作在视频域的拓展,其有效地利用视频的帧内和帧间相关性来改善重建视频的质量。具体地,VCSNet将视频序列划分为多个图片组,其中第一帧为关键帧,其采样率将高于其他非关键帧。在一个图片组中,VCSNet使用一个卷积层实现基于块的逐帧采样,这使得采样矩阵可以被自适应地优化。在重建过程中,VCSNet首先使用一个能够有效利用帧内信息的线性卷积神经网络实现逐帧视频重建,然后使用多层次深度特征补偿来用关键帧的信息有效地提升非关键帧的重建质量。这种多层次深度特征补偿方法使得VCSNet更好地利用帧内和帧间相关性来提升视频的重建质量。在6个基准视频上的大量实验表明,与目前主流的视频CS方法和基于深度学习的图像CS方法相比,具有多层次深度特征补偿的VCSNet在客观和主观指标上都显示出更好的视频重建质量。
其他文献
骨髓是人体最大的器官之一,成人男性重约3000g,女性约2600g。正常骨髓封闭于骨髓腔内,呈海绵状或胶冻状,可分为红骨髓和黄骨髓。前者以造血组织为主,含丰富树枝状静脉窦系统,其中水
为了全面了解不同大气层结条件下,玉米花粉沉降在水平和垂直方向上的分布规律,笔者利用开花期玉米花粉干沉降试验和微气象观测资料,分析了源区外花粉干沉降通量的空间分布特
基于翟镇煤矿的冒落法和充填法开采实践,对比分析了在充实率为40%~70%的7203E上充填工作面和7203E下综采工作面的矿压显现规律,得出翟镇煤矿采用不同采煤方法的矿山压力显现特
中国的新材料企业与国外是有差异的。国外的企业往往做成一个平台,中国企业则是一条线走到底。可以说,国外做应用材料的公司往往规模很大,将一样材料针对各种应用进行研发,研
将恩诺沙星按照0、20、40、60、80、100mg/kg浓度,对小体鲟及史氏鲟口服给药5天,停药2天后对其肝脏组织中微粒体蛋白浓度及细胞色素P450(cytochrome P450,CYPP450)酶活性进行测
据报道,国家能源局规划司司长江冰前不久表示,《新兴能源产业发展规划》已经形成了成熟的稿件,规划期为2011-2020年,目前正准备上报国务院,累计增加投资为5万亿元。
广州市科技和信息化局按照“前瞻布局、重点突破、市场主导、协同发展”的思路,着力培育战略性新兴产业,增强发展后劲。重点发展新一代信息技术、生物工程技术、新材料等战略性
前不久,总投资超70亿元的华泰汽车自动变速箱项目落户江阴高新区。加快延伸产业链条,如今,江阴特钢产业与汽车、装备制造、不锈钢、钢结构等产业的集聚融合,正迸发出强势的市
目的观察握拳加压包扎对手烧伤患者手功能康复的疗效。方法按随机数字表将96例患者分为对照组和观察组各48例。对照组采用常规康训练,观察组在对照组基础上加用握拳加压包扎
湖北应城县陈北乡先锋农业社副主任、县特等劳模曾开彩的3亩胜利油菜试验田,经过验收,总产2,418斤,平均亩产806斤,创造了高产纪录。他的丰产事实教育了保守思想的人,组织参