网络环境下图像隐写分析中的失配问题研究

来源 :战略支援部队信息工程大学 | 被引量 : 1次 | 上传用户:shize
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为保障信息安全的一种新手段,信息隐藏近二十几年以来一直受到广泛重视。研究隐写和隐写分析为代表的信息隐藏技术符合国家信息安全的重要需求,具有重要的学术意义和应用价值。目前学术界在图像隐写检测技术方面取得了丰硕的研究成果,且在实验室环境下表现出较高的检测性能。但不可忽视的一个问题是,这些方法在应用于实际网络环境时,由于现有的隐写取证方法大多采用基于机器学习的分类器设计模式,且往往假设已知隐写者所使用的载体来源和隐写方式(隐写算法和负载量),而实际应用中这些先验信息有可能是完全未知或部分未知,甚至还可能缺乏相应的训练样本,因而不可避免地会出现所谓的分类器“失配”问题,从而大幅度地降低检测性能。虽然近年来提出了很多针对“失配”问题的解决思路,但由于种种原因,仍然很难从根本上解决该问题,从而限制了隐写取证在实际网络环境下的应用。鉴于此,本文通过分析实际网络环境下二维先验信息(载体来源和隐写方式)的不同组合以及是否包含相应的训练样本,并结合异常检测、图像聚类、相似图像检索和特征选择等相关技术,提出一类能适用于网络环境下图像隐藏信息检测的系统设计方法,解决分类器的“失配”问题,从而推动隐写分析技术从实验室走向实际网络环境。论文的主要工作和学术成果包括:1、在已知隐写者所使用的载体来源但不知隐写方式的模式下,为了应对已有方法无法在已知(已经存在)和未知(先前没有见过)隐写算法上都获得较高准确率的问题,提出一种基于参考点局部异常因子(Local Outlier Factor,LOF)和Low-All采样的通用盲检测方法。首先,用尽可能多的已知隐写算法和混合嵌入率生成辅助载密图像;然后,采用基于参考点的LOF算法计算辅助载密样本点(特征向量)关于测试样本点的LOF得分;其次,从辅助载密图像中选择LOF得分较小的若干载密图像作为训练载密图像;最后,在载体图像和选择的训练载密图像上训练一个二分类器用于测试。大量实验结果表明,所提方法在已知和未知隐写算法上的性能都远远优于已有方法。2、在不知隐写者所使用的载体来源和隐写方式的模式下,为了避免模型失配问题,提出一种新的无监督通用隐写检测框架,即结合图像统计特性相似性检索的无监督异常检测,来识别单个载密图像。首先,给定一幅待测图像,从检索图像库中搜索出与之统计特性相似的若干载体图像作为其辅助载体样本;然后,对由待测图像和其对应的辅助载体样本构成的测试集进行无监督异常检测,从而判定给定待测图像是否嵌密。为了验证该框架的有效性,针对具有不同压缩历史的混合异构位图图像的隐写检测问题,提出一种结合位图压缩历史检索的无监督异常检测方法。该方法采用了一种低维的隐写检测特征和三种基本的无监督异常度量。在六种空域隐写算法上的实验结果,表明该框架具有以下优点:(1)不需要训练,可以避免模型失配;(2)具有通用性,即在一定程度上可以检测已经存在和新颖的隐写算法;(3)图像统计特性相似性检索的引入,减弱了载体差异对现有隐写检测特征的影响;(4)明显优于单类支持向量机和传统的无监督异常检测方法,且其性能与测试样本中载密图像所占比例无关。3、为了探究结合图像统计特性相似性检索的无监督异常检测框架与高维隐写检测特征是否兼容,以及载体差异大小对其性能的影响,针对具有不同纹理复杂度的原始未压缩图像的隐写检测问题,提出一种结合图像内容检索的无监督异常检测方法。首先,利用提出的36维纹理特征从检索图像库中搜索出与给定待测图像纹理复杂度相似的若干辅助载体样本;然后,对待测图像及其辅助载体样本进行无监督异常检测。该方法选用了四种不同维度的隐写检测特征,两种基本的以及五种处理高维数据的无监督异常度量。大量实验结果表明:(1)载体差异越大,所提框架的性能提升就越明显;(2)在载体差异较小,隐写检测特征维数较高或极高的情况下,该框架不仅能保留其通用性,而且获得了可靠的检测性能;(3)现有的或新的无监督异常度量方法都可以应用到该框架中。此外,还讨论了检索图像库中载密图像所占比例对所提框架性能的影响,且提出一种噪声图像去除的策略来对检索图像库进行预处理,从而使得所提框架更适用于实际环境。4、考虑到实际应用中可能会获得少量的训练样本,因此定义一种特殊的隐写检测模式:(1)载体图像来源未知、隐写方式未知;(2)有少量的训练样本,且和测试样本具有相同的载体来源和隐写方式;(3)训练样本中载体图像的数目要远远大于载密图像。我们称这种模式为小训练样本下的极不平衡隐写检测(Highly Imbalanced Steganalysis with Small Training samples,HISST)。针对类别不平衡问题,已有学者严格研究了采样、新的分类算法和特征选择这三种类型的方法,但在隐写检测领域却很少涉及,尤其是特征选择方法几乎都应用于文本分类和生物数据分析。因而,将八种不同的特征选择标准和三种后续分类器进行组合,在四种有代表性的隐写检测特征下,评估了各种组合的性能,获得如下结论:(1)将特征选择算法和Fisher线性判别器组合,可以有效地克服HISST问题,即使是在高维的隐写检测特征下;(2)就平均性能和平均最优特征数目而言,对于低中维隐写检测特征,基于优化Fisher和等级相关系数的算法是最好的选择;而对于高维隐写检测特征,基于滑动阈值的特征评估算法分类性能最好。此外,还对比了上述三类方法和其组合的性能,可以得出,在大部分情况下,特征选择方法优于采样和新的分类算法,而且这三类方法的组合并没有产生进一步的改进结果。最为重要的是,随着样本数目的增加或类别不平衡度的降低,特征选择方法逐渐失去了解决不平衡隐写检测问题的优势,甚至比使用全部特征的线性支持向量机的性能更差,这种趋势对于高维隐写检测特征尤为明显。最后,归纳总结了本文工作,并对网络环境下图像隐写分析技术的发展和研究进行了展望。
其他文献
计算机断层成像(Computed Tomography,CT)技术以无损、非接触的方式对物体进行三维成像,广泛应用于医学诊断、工业检测、安全检查、文物修复等领域。在实际应用中,成像系统与理想模型之间的偏差,会导致CT重建图像出现各种伪影。其中,几何伪影是由实际成像系统空间结构与理想几何模型参数失配所引起的图像伪影,表现为重建图像边缘模糊及重影,导致成像分辨率降低和图像质量下降。因此,准确高效的几何
学位
路由器作为互联网基础设施,主要提供数据转发,网络寻址等重要任务,其安全状况对所在网络具有举足轻重的影响。Cisco作为全球最大的互联网设备厂商为全球骨干网络提供着最广泛的服务。虽然Cisco公司一直致力于提高其路由器的安防水平,但由于Cisco路由器型号和IOS版本众多,给安全研究带来困难。一些IOS漏洞和针对性攻击方式只有在安全事件爆发时才会被发现,造成大量经济损失。本文希望借鉴蜜罐思想主动发现
互联网通讯技术的快速发展和网络规模的扩张使得网络中出现越来越多的应用程序,除了已知的应用流量外,还有大量未知的、私有的或者恶意的网络流量,这对网络安全提出了巨大挑战。另外,网络流量识别是与各种网络安全应用程序有关的基本问题,例如入侵检测和防御系统、网络管理系统等,通过对网络流量的精准分析,可以检测恶意流量的攻击,及时采取应对措施,并根据统计结果合理配置网络资源以提供更优质的网络服务。然而,随着流量
学位
随着计算机技术和兵棋技术的发展,兵棋推演受到越来越多人的喜爱和关注。在军事方面,部队越来越重视基于真实环境的兵棋推演;在兵棋游戏的设计与制作方面,设计者也越来越重视游戏参与者的体验。目前国内针对兵棋地图,特别是基于真实地理环境的兵棋地图的研究较少,基于兵棋地图的路径分析研究更少。不论是游戏还是兵棋系统,其场景大多以六角格网模型为基础构建而来。因此,本文从当前我国兵棋地图使用最多的六角格网数据着手,
学位
多输入多输出(MIMO)系统作为一种新型的无线通信技术,在解决系统带宽资源有限和高速通信的矛盾中作用明显,因而得到了广泛的关注和应用。在认知无线电或信号截获背景下,对空时方案未知条件下MIMO系统接收技术进行研究不仅具有巨大的经济价值,还具有重要的军事意义。本文在分析MIMO系统特征、空时分组码特点以及技术要求的基础上,系统研究了空时方案未知条件下MIMO接收的理论和方法,主要内容和成果如下:(1
当前互联网“僵化”的IP体系结构和“尽力而为”的服务模式无法从根本上满足多样化业务请求、泛在化服务管理、异构网络融合、定制化功能提供等迫切需求,导致业务需求与网络内在能力之间的差距愈发显著,对建立新型网络体系的需求尤为迫切。鉴于此,可重构信息通信基础网络以功能细粒度划分为切入点,通过增强现有的网络层和传输层功能,构建了一个功能可动态重构和扩展的基础物理网络,为不同业务提供可定制的基础网络服务,极大
学位