基于注意力残差网络的以图藏图研究

来源 :南京信息工程大学 | 被引量 : 0次 | 上传用户:changlang0p
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当今时代,人们在互联网中产生的数据在以每18个月翻一番的速度迅猛增长,其中占据最大比例的数据形式是图像。在巨大网络资源涌入的背景下,人们也面临着信息安全的巨大挑战。以图像为主要数据载体的信息安全相关研究已经受到了广大研究者们的关注,其中一项重要的研究工作就是以图藏图。以图藏图技术是把需要隐藏的大容量信息分散、嵌入和融合到另一张载体图像中的隐蔽通信技术。该技术的发展得益于近年来快速兴起的深度学习。以图藏图技术相比较于传统的基于手工失真函数设计的信息隐藏方法有着巨大隐藏容量的优势。目前,几乎所有的以图藏图方法都是通过自编码器架构直接重建含密图像。然而,这类方法所得到的含密图像往往视觉质量偏低,容易产生失色、模糊等现象,而且难以对隐藏图像高精准恢复。本文通过对以图藏图问题的深入研究,发现以图藏图任务的本质是解决一个带条件的最优化问题。导致含密图像质量偏低有以下两方面原因:第一,直接重建含密图像的方法是从巨大的解析域中求解优化问题;第二,信息在图像中的隐藏和提取是一个互相干扰的过程。为了解决上述问题,本文从以图藏图任务和深度学习技术两个角度进行探索,提出了改进的深度以图藏图方法,详细的研究成果如下:(1)本文提出了基于残差学习的以图藏图算法框架。通过其他计算机视觉研究领域的先验知识,本文把以图藏图任务重新定义为在载体图像上附加上残差图而不是直接重建和恢复含密图像。(2)根据基于残差学习的以图藏图算法框架,本采用全局残差连接和局部残差块组合的方式构建网络架构,称为Res Hiding-Net。此外,该方案还提出了新的基于离散余弦变换的注意力机制,使得隐藏图像能够更高效地分散到载体图像中,从而进一步提升含密图像的视觉质量和隐藏图像的恢复精度。(3)根据基于残差学习的以图藏图算法框架,本文提出了基于残差学习的以图藏图网络的第二个实现方案,即结合Swin Transformer和U-Net的以图藏图网络SU-Net。该方案一方面通过自注意力机制对CNN的局部性感受野进行信息补偿;另一方面,网络通过协作式迭代训练策略,使得整个隐藏和恢复网络能够更加针对性地完成对应的工作。
其他文献
隐写术是将敏感信息隐蔽地嵌入到图像等通信载体中,并进行公开传输的一种隐蔽通信技术,可以实现敏感数据“神不知鬼不觉”地秘密传输。同时,违法分子也会利用隐写术来从事非法犯罪的活动。因此,为了防止隐写技术被用来造成一些危害社会的信息安全事件,隐写分析技术受到国内外学者的广泛关注及深入研究。近年来,深度学习在图像隐写分析任务中表现出了优越的检测性能。然而,基于深度学习的图像隐写分析模型需要隐写算法对应的大
学位
视频目标分割是机器视觉中最基本的任务之一,在实际应用中发挥着重要作用。根据是否有人为的参与,可以分为无监督视频目标分割和半监督视频目标分割。本工作旨在研究半监督场景下的视频目标分割任务,即根据人为标注的视频首帧的目标掩码注释,来完成后续帧中的目标掩码预测。当前,基于时空记忆的方法由于其优异的性能,受到了广泛欢迎。其基本思想是通过构建一个外部记忆库来记忆历史帧中目标对象的信息,然后将查询帧中的像素与
学位
随着神经胶质瘤发病率逐步上升,作为关键辅助诊疗手段的医学图像处理技术受到了越来越多的关注。其中,脑部磁共振图像分割与重建算法的有机结合能极大便利诊疗决策、模拟手术、术后规划以及医疗教学等医学任务。因此,分割与重建算法的设计一直都是医学图像处理与计算机辅助诊断领域备受关注且极度活跃的研究热点。然而,在成像过程中,高斯噪声和莱斯噪声经常叠加出现,造成采集到的图像质量退化,导致分割精度受限。同时,现有的
学位
随着电子信息技术的发展,图像作为一种信息的载体,在人们的日常生产生活中被广泛地用来传输信息。但是,在图像的传输、压缩、存储或者相机的拍摄过程中都有可能产生信息丢失,从而导致图像整体质量的下降。因此,如何建立一个高效、准确的图像质量评价方法成为了计算机视觉领域的重要问题。随着深度学习的发展,越来越多的方法将卷积神经网络应用到图像质量评价领域中,并取得了良好的预测准确性。然而,失真图像中包含丰富的图像
学位
图像版权保护通常是通过数字水印来实现的,因此数字水印也广泛应用于数据保护和数据所有权认证领域。然而,现有的数字水印存在固有的缺点,需要完全可信的第三方作为仲裁方,泄露风险和成本较高。第二,图像水印算法在对图像数据进行操作时不可避免地会导致图像数据的丢失,而这通常是不可逆的。零水印算法可以解决数据丢失的问题,但与传统的数字水印相比,零水印算法更依赖于可信第三方,这使得其应用前景受到限制。总体而言,本
学位
行人重识别(Person re-ID)的目标是匹配由拍摄视角不重叠的不同摄像头捕获的相同行人身份的图像。目前基于监督学习的行人重识别方法在单域上的性能提升最大,但是将一个在单域上取得高性能的模型直接运用到没有标签的新域上时,往往性能会出现下降的情况。这是因为不同域间样本由于拍摄的摄像机不同,因此会有比较大的域间差,这也是无法高效地将行人重识别使用在实际生活中的一大原因。为解决上述问题,学术界提出了
学位
随着人工智能技术的快速发展,神经网络与气象领域的结合更加紧密。在灾害预警方面,短临预报系统发挥着重要的作用,当前业务上主要的方法是基于雷达回波的外推法,但是预报效果还有很大提升空间。本文从深度学习的角度出发,研究和改进了基于长短时记忆网络(Long Short-Term Memory,LSTM)的预报方法。本文的主要研究内容如下:(1)本文提出了一种残差卷积长短时记忆模型。在高强度回波外推场景下,
学位
隐写技术一直是信息隐藏技术的一个重要分支,它可以很好地保护机密信息的安全传输,例如军事信息、商业信息的传递等,具有重要的现实意义。过去,主要是通过经典隐写的方法来保护信息的安全传输,但随着近些年来人工智能技术和量子技术的不断发展和突破,经典隐写面临着越来越大的风险和挑战。因此,设计出能够抵御未来量子计算机攻击的隐写协议是十分有必要的。为此,本文利用量子图像的特性以及经典编码的优点,对具有高嵌入效率
学位
当前基于数字水印技术的图像版权保护方案中采用的传统水印算法主要适用于单幅图像,而在为大量图像提供保护时,重复性的操作会花费大量的时间和认证费用。零水印算法相较于传统水印算法不仅不会修改图像的数据,而且更适合对多幅图像同时进行版权保护。现有的多幅图像零水印算法虽然能够实现同时为两幅或三幅及以上的图像提供版权保护,但这类算法难以保护图像集内的全部图像,而且重复性操作还会降低算法的执行效率。因此,本文针
学位
短临降水预报是一项重要且具有挑战性的世界性难题。由于降水本身具有高度非线性、随机性和复杂性的特性,使得传统方法的预报准确率不足以满足气象业务的需求。目前短临降水预报的主要手段是基于天气雷达资料的雷达回波外推技术,基于深度学习方法进行雷达回波外推已经受到研究人员的广泛关注。深度学习方法具备对非线性复杂系统进行建模的能力,且在准确率方面已经超越了传统方法。但目前提出的雷达回波外推模型仍存在一定的不足,
学位