论文部分内容阅读
数字化时代扩大了造假范围,降低造假成本,一些违法者为了某种利益伪造数据、信息、新闻等。图像伪造亦是其中一类,多媒体技术和数字图像处理软件的简单快捷,让图像伪造变得肆意,图像篡改检测技术应运而生。同图复制篡改是图像伪造的常见篡改类型。针对该类型,当下主流研究方向分为基于特征点检测和基于块匹配检测,二者各有优势。综合来看,特征点检测的准确度更高,适用范围更广,但特征提取和匹配结果过于依赖选取的尺度空间和像素梯度方向。而块匹配检测有更多的改进空间,本文选择基于块匹配检测方式,重在提升检测准确率并降低时间复杂度,主要研究内容如下:1.特征提取和聚类算法适用性分析:将灰度图像分块,提取每个分块的某类特征进行特征匹配是较常见的检测方式。本文在特征选取上进行创新,除了选择常见的空间域特征外,应用深度学习领域的自编码概念提取特征,分别将两种特征进行聚类,以分析聚类算法针对同图复制篡改的适用性。2.空间域特征聚类算法:该算法模型相对简单,用k-means聚类算法直接聚类特征矩阵,再用异常块去除算法即欧氏距离判定和RANSAC(random sample consensus)算法去除异常块,最终得到正确检测区域。3.稀疏自编码特征聚类算法:自编码特征提取相对复杂,结合聚类算法检测图像。选择稀疏自编码器训练给定同图复制篡改图像样本集,通过自学习方式找到图像内部规律,快速提取测试集的稀疏自编码(Sparse Autoencoder SAE)特征,再结合k-means聚类算法进行特征聚类,聚类结果会将图像的平滑区域去除,这极大缩减了计算量。kmeans一次聚类结果可检测出结构简单的图像。对于结构复杂的图像,k-means二次聚类图像剩余块的纹理特征和灰度特征,若检测结果含有异常块,用异常块去除算法得到正确检测区域。实验结果表明,SAE特征聚类算法与其他算法比较综合准确率提升14.3%,时间效率提升72%。对JPEG压缩有很强的鲁棒性,设定压缩因子取值范围[75,95],检测结果的precision和recall值都在0.8以上。针对图像篡改区域旋转操作,SAE特征聚类算法具有一定适应性,对结构复杂度不高的图像,选取5个角度分别进行测试均成功检测。在时间效率上,SAE特征聚类算法大幅度降低检测过程的时间复杂度。针对基于块匹配检测,聚类算法适用于不同特征,通过块聚类提升特征匹配过程的效率。特征提取方面结合深度学习领域,通过自学习方式达到快速提取特征,极大缩减检测时间,但针对结构复杂图像的旋转、模糊等操作,特征聚类算法模型还需改进。