论文部分内容阅读
根据对数字图像篡改采用的技术不同,取证主要分为两类:对拼接图像的取证和对复制粘贴篡改图像的取证,本文主要是针对拼接图像进行取证研究。目前对拼接图像的取证算法还存在很多的不足,原因之一在于找不到能准确反映图像原始性的特征信息。现有的算法具有以下几个缺点:算法的适用范围较小,精确度不高,不能兼顾检测准确率和定位精确度,依赖于所使用数据库等。当前的很多取证算法采用监督学习的方法对待鉴定图像进行篡改检测,需要大量的训练样本,基于样本训练的取证算法稳定性和有效性很大程度上依赖于样本图像某些特征分量的稳定性。由于篡改标准图像库建库的复杂性,目前这类图像库很少,且目前建立起来的篡改取证图像库还正处于不断的完善之中,这在一定程度上限制了有监督学习方法在图像取证领域的应用。本文从数字图像的形成过程角度出发,探索性的提出一种不依赖于训练样本的基于非监督学习的取证系统框架。本文将拼接图像看作包含不同数据结构的集合,将对该图像的拼接篡改取证看作对这个集合中数据的分类问题,因此,对图像的鉴定只依赖于图像本身的信息,无需训练样本,从一定程度上缓解了由于取证数据库不完善而引起的问题。在给出取证系统框架的基础上,提出两种不同类型的检测算法:基于JPEG块效应的拼接篡改取证算法和基于图像噪声特性的非压缩拼接篡改取证算法。在JPEG图像的取证算法研究中,分析了由于JPEG压缩引起的块效应,给出在图像取证中块效应测度的选取原则。基于此原则提出了改进的局部块效应测度,并采用渐进寻找阈值的方法将其应用到JPEG图像取证算法中,采用该测度的取证算法标定出的篡改区域更加精确。在非压缩篡改图像取证算法研究中,探索了非压缩图像局部像素点的分布特性,从数字图像形成过程的角度解释了真实图像的峰度系数集中现象。基于真实图像和篡改图像在峰度系数集中程度的差异,提出篡改预判定式,从而实现不依赖于其他数据库直接从图像本身判定是否经过篡改的稳定算法。提出全局噪声特征值的概念,给出了k均值算法的聚类中心,从而解决了k均值算法起始聚类中心选择问题。实验表明,采用本文提出的算法在定位篡改位置的精确度上具有更好的性能。