基于深度学习的篡改图像中的拼接定位研究

来源 :南昌大学 | 被引量 : 0次 | 上传用户:vickyfucandy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数码相机、手机等成像设备的快速发展,数字图像已经成为传递信息的重要载体。然而伴随着图像编辑软件功能性和易用性的增强,篡改者可以轻松制作篡改图像,给司法取证、商业宣传、荣誉保护、新闻甄别等领域带来巨大担忧,因此篡改图像的取证研究具有非常重要的现实意义和应用价值。本文研究的是常见的篡改操作之一的拼接篡改。现阶段关于拼接篡改检测的研究方法主要分为基于手工提取特征的传统检测方法和基于深度学习的检测方法。传统的检测方法因为其提取的特征的局限性,鲁棒性较差。而基于深度学习的检测方法凭借其强大的特征提取能力,能够实现端到端的包括拼接篡改的多种篡改手段的检测。针对基于深度学习的拼接篡改定位问题,本文开展了两个方面的研究。(1)提出了一种改进型的Unet算法模型DAUnet。针对Unet网络实现图像篡改区域定位性能不足的缺陷,我们做了两点改进,第一,对于Unet采样环节中特征提取能力不足的问题,将Unet的采样环节中融入了 DenseNet中的DenseBlock,增强了特征重用和特征提取能力;第二,对于不同形状大小的篡改区域的定位分割不精确的问题,我们加入了空洞空间卷积池化金字塔(Atrous Spatial Pyramid Pooling,ASPP),以使得在增大感受野的同时可以捕获多尺度信息,提高定位精度。最终得到基于DenseNet,ASPP的改进Unet模型DAUnet。实验表明,DAUnet在合成数据集、Columbia、CASIA1、CASIA2的评价指标均优于对比算法。(2)在DAUnet基础上,提出了一种融入注意力机制的改进的多任务学习算法模型AttDAUnet。首先,借助空域富模型(Spatial Rich Model,SRM)滤波器对图像进行滤波,放大篡改图像的痕迹;接着在每个解码器层上引入一个全局注意力上采样模块,提供全局上下文作为低层信息的指导,来提高低级语义信息中重要信息的敏感度,避免冗杂无用的低级语义信息干扰解码操作;然后引入了多任务学习的方法,使得网络有定位篡改区域和边缘两个输出任务,通过底部参数共享层,把两个任务的数据信息嵌入到同一个语义空间中,使它们在特征提取过程中保持共享、共同训练、相互补充,有效降低网络过拟合的风险,最终提高模型的性能。实验结果表明,最终得到的AttDAUnet的多任务学习的算法模型,在CASIA2和CASIA1数据集上做了充分的消融实验,展示了算法改进的有效性;在CASIA1上面对不同程度的图像压缩和模糊等鲁棒性测试的实验中,展现了算法良好的鲁棒性。
其他文献
无线定位技术广泛应用于军事领域和民用领域。军事领域以雷达定位为主,雷达利用目标对电磁波信号的反射实现对目标的定位。民用领域通常利用已有的通信基础设施,通过发射和接收电磁波信号的方式实现对用户的定位。其中,毫米波定位技术因其拥有较高定位精度、低延迟、可集成度高等优势备受关注。然而传统的5G毫米波定位系统中毫米波信号容易受到障碍物的遮挡,降低了定位能力的可靠性;另一方面,现有的定位精度仍不能满足虚拟现
学位
许多数字图像涉及个人隐私、企业隐私或军事机密等信息,这些信息在传输过程中往往存在被窃取或篡改的风险。安全且高效的图像加密算法是保障数字图像安全传输的关键手段之一。本文提出了两种基于实值离散Gabor变换和比特置乱的混沌彩色图像加密算法。本文的主要研究工作如下:设计了一种基于实值离散Gabor变换和比特置乱的混沌彩色图像加密算法。通过实值离散Gabor变换将图像信息转换到变换域进行加密。以明文和初始
学位
通过特殊的介质记录物光和参考光的干涉条纹,经激光器照射,再现物体真实三维图像的技术称为计算生成全息技术(Computer Generated Holograms,CGH)。然而,CGH技术面临的最大挑战是算法运行时间和图像质量之间的基本权衡,这阻碍了高质量全息图像的快速合成。此外,由于光学再现时,光传播模型与其模拟模型不匹配,导致大多数显示器的成像质量较低。为解决这些问题,本文的主要贡献如下:(1
学位
在荧光偏振调制技术中,当旋转线偏振光的偏振状态,荧光分子的辐射强度受到其极化方向与入射光偏振方向之间的角度调制。荧光强度以余弦平方的响应发生变化,增加了采集图像的稀疏性。利用图像的稀疏性,进行偏振调制解调算法迭代重构图像,获得分辨率进一步提高。本课题研究了荧光偏振调制在显微成像系统中进一步提高分辨率,即开展了荧光偏振调制的理论模拟分析。在此基础上,开展了荧光偏振调制应用于宽场荧光成像实验研究,并提
学位
当前互联网用户快速增长,社交媒体已成为人们信息分享与信息获取的重要平台,从社交媒体平台中提取反应现实生活极具价值的热点事件,构建逻辑连贯的故事脉络,有助于我们迅速掌握舆论焦点,捋清事件的发展脉络和趋势。现有无监督事件探测方法大多数只是利用词频或者词共现特征,没有利用文本的语义特征,本文基于大规模社交网络数据生成Word2Vec模型获取文本语义特征,并提出融合文本语义和共现关系的Text-Graph
学位
近距离属性成像提供生物组织吸收率与散射率信息,广泛应用于皮肤病临床诊断、消化道早癌原位筛查和果蔬病害检测等领域。经典光学属性反演方法假定的光源为平行入射光,而近距离宽场结构光照明不满足该情形。本文基于朗伯体漫反射模型,引入目标表面形貌信息可提高光学属性反演精度。基于上述思路,研究基于三维形貌矫正的属性参数估计算法、系统搭建和单次曝光快速成像方法。首先,为了同时测量两种信息,设计了一套基于结构光的三
学位
随着6G通信感知一体化的深入研究及LED照明产业的蓬勃发展,以LED作为照明源和信号发射机的可见光通信(VLC)技术颇具应用前景。多色照明LED通过波分复用能提升传输速率,实现正常照明和高速通信的复用。本文选取多种照明参数对多色CSK调制星座点进行建模优化,并设计了通信照明一体化的多色VLC系统,旨在高速通信时能满足照明需求,主要研究内容如下:1、首先对LED照明混光方法及多色VLC调制技术进行综
学位
说话人识别是指利用说话人的语音特征识别说话人的身份。说话人识别可以广泛应用于司法鉴定、智能语音助手等领域,一直是语音信号处理方面的一个研究热点。本文提出了基于独立向量分析和并行卷积神经网络的语音特征融合算法来实现说话人识别。论文的主要研究工作如下:1.提出了一种基于独立向量分析的语音特征融合算法。首先,分别提取说话人的语音信号的时域特征和频域特征,将该说话人的时域特征和频域特征分别构成时域特征矩阵
学位
在当今社会中,5G技术以其高速率、低时延和大连接的特点成为了近几年来通信领域的新宠儿,但是从4G到5G的转换过程并不像前几代通信技术那样顺利。由于更新通信设备的高昂成本以及5G技术发展的一些限制,诞生了非独立组网的一些特殊的网络架构。随着通信技术的升级换代,通信安全也面临着更大的挑战。对于一些通信安防技术而言,获取终端的身份信息是必不可少的一个环节。因此,本文提出了一种5G非独立组网Option
学位
数字调幅广播(DRM)外辐射源雷达由于采用了第三方信号作为探测源,在实现目标探测时需要首先解决参考信号的提取问题。针对这一问题,为了使参考信号提取方法更简单高效、进而为该体制雷达信号处理提供一种新颖的智能化手段,本文利用深度神经网络强大的数据特征学习能力,研究基于学习DRM外辐射源雷达参考通道回波数据特征的参考信号提取方法。具体研究内容如下:(1)基于参考通道回波数据存在时间相关性特征,研究了两种
学位