基于伪造缺陷与语义对比的deepfake检测

来源 :云南大学 | 被引量 : 0次 | 上传用户:hongwei3330857
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伪造图像或视频的检测一直是计算机视觉与信息安全领域的研究重点。随着诸如自动编码器和生成对抗网络等深度生成模型的显著发展与进步,人们现在可以轻松地使用开源工具甚至移动应用操纵图像和视频。最为知名的deepfake是指基于深度学习制作的虚假多媒体内容,即深度伪造。鉴于deepfake较低的制作门槛且高质量的伪造效果,这些技术很容易被恶意者滥用,包括传播虚假新闻,色情报复,金融欺诈甚至影响政治舆论。因此,行之有效的deepfake检测技术是迫切而重要的需求。虽然deepfake检测算法得到了许多关注和研究,但当前的方法仍存在如下局限性:第一,一些局部操纵方法伪造的和高质量的deepfake仅存在细微的伪造伪影,导致大多数检测方法的有效性不足。第二,检测算法在现实应用中的鲁棒性不强,如上传至社交媒体平台的伪造图像或视频通常经过不同程度压缩的场景。第三,现有的检测模型通常直接使用数据训练深度神经网络进行分类学习,虽然它们在数据集内的测试结果可观,但在跨不同数据集或伪造方法进行检测时的泛化性严重不足。为了应对这些挑战,旨在提升deepfake检测的有效性,泛化性和鲁棒性,本文基于伪造缺陷与语义对比对deepfake检测进行了研究,并提出了两个创新性的方法。针对检测不同deepfake操纵方法的有效性以及在压缩环境下的鲁棒性,本文提出了一个基于空域与频域中局部伪造缺陷的deepfake检测算法,命名为局部伪影感知的deepfake检测网络(LA-Net)。该算法的研究旨在放大真实图像与伪造图像在空域和频域中隐含的局部差异,而不是特定的外观特征。该工作创新性地设计了两个模块:局部风格提取模块(LSEB)在空域中对局部风格进行编码,从而提取更具判别性的特征;Patch-wise频谱交互注意模块(PFSCA)在频域中交互地挖掘幅度谱和相位谱上的局部伪造伪影。通过双分支的深度学习网络,该算法同时在空域和频域中捕获细微的局部伪造缺陷。在不同操纵方法和压缩场景下的大量实验证明了提出的deepfake检测方法的有效性和鲁棒性。为了提升deepfake检测的泛化性,本文工作关注到了各种deepfake伪造算法主要是对人脸所蕴含的内容和信息进行操纵。以人脸语义内容存在的伪造缺陷为突破口,本文创新性地提出了一种基于语义分割与对比分类的检测算法。该方法将人脸语义内容和非语义内容进行分割,并针对语义特征进行额外地对比学习。语义分割使能在语义内容中学习不同deepfake之间共同的伪造缺陷。对比学习强迫编码空间中同类特征更紧凑且异类特征的间隔更大,这进一步提升了模型泛化性。通过大量的跨数据集测试实验和对比评估,证明了提出的方法能显著改善当前基于深度卷积神经网络的deepfake检测模型的泛化能力。
其他文献
遥感图像涵盖丰富的宏观信息,可有效帮助人类动态地监测地表信息,从而进行特征绘图、土地覆盖分类、变化检测等。虽然近年来,场景分类、目标定位、目标检测等众多技术应用在遥感图像上,为人类创造了许多有价值的应用,仍存在以下亟待解决的问题:遥感成像设备价格高昂,只能获取低光谱分辨率的全色图像,或低空间分辨率的多光谱图像。为解决上述问题,国内外学者展开相关研究。常用方法有全色锐化算法与超分辨率算法。其中全色锐
学位
现代商业模式下,为完成特定任务目标,企业之间需要进行相互协作,此过程被称协同业务过程。与传统业务过程相比,协同业务过程具有面向过程组合、组织自治和流程抽象的新特性。此外,在协同业务过程实际执行过程中,为了确保其有效执行,正确性验证也是需要关注的重要问题。因此,在保证协同业务过程新特性的前提下,如何有效的对其进行正确性验证成为当前业务过程管理领域的研究热点。本文提出一种基于Petri网的面向公共过程
学位
在这个大数据的时代,个人信息的隐私保护越来越受到每个人的重视,然而,在日常生活中,我们常常需要向网络服务商提供自己的信息以获得更好的服务,与此同时,可能出现的个人信息泄露会对我们的生活产生负面影响。而对于网络服务商,收集用户数据除了能更好的为用户服务,同时也能通过数据分析获得潜在的有用价值,因此网络服务商可能会将数据授予第三方机构进行数据分析,第三方机构可能存在泄露数据的行为。因此既要保护用户的个
学位
软件缺陷对软件质量甚至软件经济有着重要的影响。为了减少软件缺陷带来的损失,软件工程领域最活跃的问题之一是如何高效率、准确的发现软件缺陷。20世纪90年代,人们发现缺陷在软件中并非随机地分布。随后一系列针对软件缺陷倾向性、数量、严重程度、分布规律等的预测模型相继提出。然而真实的软件开发场景中无法保证每一个软件系统都具有丰富的变更日志数据。特别是面向新开发、小规模软件系统时,由于缺乏训练数据导致软件缺
学位
随着物联网、互联网技术的快速发展、第五代通信(fifth-generation,5G)技术的普及、功能强大的终端设备和新的交互式移动应用程序的出现,我们正处于一场数据革命之中。云计算的范式已经无法满足人们对低时延、低功耗、高带宽的通信需求。而移动边缘计算(Mobile Edge Computing,MEC)将计算、存储以及网络控制能力转移到网络的边缘,可以减少时延、能耗,同时提高带宽,为用户提供了
学位
差分进化算法(Differential Evolution,DE)是一种典型的随机优化算法,其主要通过变异、交叉和选择操作的循环迭代来进行全局搜索,其中变异操作对算法的影响尤为显著。尽管至今为止已经有各种类型的DE算法变体被相继提出,但在某些复杂工程优化难题上,DE算法及其变体仍然容易遭遇种群早熟收敛、搜索停滞等问题。其中一个很重要的原因就是算法的全局勘探(Exploration)和局部开发(Ex
学位
报纸
以乙二醛替代甲醛合成木材浸渍改性用三聚氰胺-尿素-乙二醛(melamine-urea-glyoxal,MUG)树脂,通过对不同温度、p H值、原料配比条件下合成的MUG树脂性能进行分析,优选出较佳的合成工艺,并用优化工艺合成的MUG树脂对杨木进行改性。结果表明:当反应pH值在4~5,反应温度为65℃,M、U、G量比为0.08∶0.40∶1.00时,合成的MUG树脂性能较佳,黏度为15.01 s,固
期刊
图着色问题是最著名的NP-hard问题之一,在现实应用以及理论研究方面都有很重要的意义。目前解决图着色问题的方法主要有两种,精确和启发式。启发式算法有快速的求解能力和很强的通用性,在实际问题中通常能找到最优或者接近最优的解。禁忌搜索算法是一种启发式算法,它应用于图着色问题能带来高质量的解,命名为Tabucol。禁忌搜索算法是在局部搜索的基础上引入禁忌列表和相应的管理规则来实现的,它有效的避免了搜索
学位
在新型冠状病毒肺炎(COVID-19)的诊疗中,专业医师通过观察患者肺部CT影像病灶情况判断病情,这和标签为分割图的医学影像分割任务类似,目的在于提取目标影像中感兴趣的区域,如病灶、组织器官等,由于CT影像数量较多,专业医师工作量较大,因此利用计算机辅助医师诊疗有重要意义。医学影像常缺少金标准数据,从半监督学习角度出发,可以减少对金标准数据的依赖。一些半监督分割方法通过一致性正则化得到高质量伪标签
学位