基于半监督学习的JPEG图像隐密分析方法

来源 :大连理工大学 | 被引量 : 0次 | 上传用户:flysnake
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像隐密分析的目的是,通过分析网络日常图像的微观统计特征,检测图像数据中可能潜藏的秘密信息,以打击恐怖组织及不法分子对隐密(即信息隐藏)技术的滥用。传统的隐密分析技术多采用提取图像对嵌入机制敏感的特征,并使用二类分类器或者多类分类器构建模型,然后对待测样本进行隐密判决。然而大多数的分类系统的分类精度严重依然于有标记训练样本的数量。因此,如何在有限数量的标记样本下,充分利用网络以及社会生活等领域中积累的大量无标记样本来提高隐密判决精度已成为隐密分析领域亟待解决的问题。本文结合半监督学习方法,利用有限的有标签数据,充分挖掘大量的无标签样本信息,提出一种基于集成映射的隐密分析方法并将其改进,旨在为研制准确性更高和实用性更强的图像隐密分析技术提供新的理论及技术支撑。不同于以往的通过调整未标记样本的数据边界进行分类的半监督学习方法,本文从所有的可利用数据包括标记样本和未标记样本,学习一种新的图像表示方法,并使用普通的监督学习提取新的特征。首先,充分利用仅有的少量标记样本训练并粗分类所有数据,选择具有代表性的图像组成能够代表部分类别信息的原型集合;其次,使用多类分类器学习这些原型集;最后,将待测图像表示为在这些原型集上的预测值,将所有的原型集上的特征映射组合成图像的新特征,进行进一步分类。实验分析了5个隐密方法并和经典MFS-274以及具有很好的隐密分析性能的Rich Model算法进行对比,实验显示了本算法的性能在标记样本个数小于50的时候依然要优于对比算法。尤其对于2013年提出的安全性很高的J-UNIWARD隐密术,在标记样本为50, MFS-274完全无判决能力,Rich Model准确率为51.89%的情况下,本方法的分类准确率依然能达到74.44%。基于特征映射的隐密分析方法是对图像进行特征映射,所提取的特征可以适用于其他的分类器以及机器学习方法。本文将其与协同训练结合。首先,将该算法特征分为两个视图,使用有标记的样本初始化两个分类器;其次,以迭代的方式单独训练两个分类器,在每一次迭代中,通过独特的数字编辑技术保证正确预测标记置信度,将标记置信度高的样本传递给另一个分类器,从而增加另一个分类器的训练样本集。再次,为了避免加入噪声样本降低分类器性能,对加入另一个分类器的训练样本个数进行控制。最后,当满足迭代终止条件时,终止迭代对待测样本进行判决。大量的实验证明了该算法能够很好的处理标记样本稀缺的JPEG图像隐密分析问题。即使是在只有10个标记样本,待测样本为990时,对MB1的辨别能力相较于MFS-274依然能提升了5.96%。
其他文献
GSM(Global System For Mobile Communication)是第二代移动通信的典型代表,目前拥有的用户最多。GSM的运行离不开其基站的正常工作。因此,基站维护工作是运营商考虑重要问题
随着互联网的快速发展,智能手机的迅速普及,数字音频得到了广泛使用,同时也让音频的真实性和完整性的鉴定成了一个研究热点。而各种操作简单、使用方便的数字音频处理软件在网络
随着科学技术的进步与发展,机器替代人的可能性逐渐提高。物体检测是人类视觉的最基本的功能之一,从Marr提出了三层计算视觉模型用来理解人脑视觉系统之后,越来越多的科研工作者
射频识别(RFID)技术是一种非接触式自动识别技术,通过发射电磁波信号对特定目标进行识别并读取目标中所含的特定信息。相比条形码技术,RFID技术具有读取距离远、穿透力强、信
随着监狱关押犯人的数量不断增加,犯罪人员社会成分复杂,许多犯罪人员还是技术犯罪,思维活跃,加之监狱的监管不利,导致个别发生袭警越狱事件,对社会造成极其恶劣的影响。犯罪分子越
星载雷达(SBR)在现代生产生活中扮演的角色越来越重要,它克服了地面雷达、舰载雷达和机载雷达的诸多缺点,有着全天候、探测空域非常大、预警时间长、不受领空限制等优点,在民
计算机断层成像在理论上可以归结为由投影重建图像问题,算法上可以分为解析算法和迭代算法。解析算法建立在连续模型上,以傅里叶中心切片定理为理论基础,重建速度快,成像质量较好
学位
随着光纤通信单波道速率向40Gb/s及以上速率发展,传统的编码格式缺点逐渐凸现出来,各种非线性效应、偏振模色散显著增强。因为偏振编码具有偏振特性好、功率均衡性好、功率代
近年来,随着自动驾驶成为全球研究的热门项目,作为自动驾驶技术的核心任务之一,道路交通情况的目标检测也越来越受到重视。目前目标检测的方法有很多,这些方法的应用为驾驶员