论文部分内容阅读
随Internet的发展和普及,企事业单位在信息化过程中产生了大量的电子文件,包括一些涉密图像文件。电子图像易于复制传播,容易引发涉密信息的泄密问题。因此开展以加强涉密图像信息保护为目的的泄密检测和泄密者追踪研究,对企事业单位和政府部门的信息安全具有重要的理论价值和实际意义。网络环境下的泄密检测会面临海量数据处理问题,而要处理海量数据又不可避免会涉及数据聚类问题。在进行数据聚类时,将会因某三个对象之间的三对关系中两对相似而第三对不相似这种结构的存在而给聚类结果引入误差。针对这种情况,定义了不传递三角IT (Intransitive Triangle)的概念,给出了基于IT的数据聚类方法及相关定义,说明了满足该数据聚类方法三个聚类约束条件的数据聚类能有效避免因IT存在而引入的误差,但该方法的聚类问题是NP难度问题。针对可能存在的聚类误差,定义了缺失性误差和误判性误差的概念,建立了这两类误差的评判标准,同时针对缺失性误差的产生情况明显比误判性误差的产生情况要复杂得多这一实际问题,给出了缺失性误差的计算方法。借助数字水印和数字指纹技术,提出了利用嵌入在涉密图像中的用户指纹来排查泄密图像的泄密检测方法,给出了相关算法并分析了性能。在这种方法中,如果用户数量较大,会导致系统效率较低,为此提出了机构水印的概念。通过使用机构水印替代用户指纹来作为泄密检测的主体,较之于以用户指纹为泄密检测主体的算法有较大性能提升。由于在基于用户指纹和基于机构水印两种泄密检测方法中均会涉及码值比较问题,为保证有较好的码值比较效率,给出了一种基于LSH (Locality Sensitive Hashing)聚类的码值比较方法。通过在进行码值比较前使用LSH方法对总码集进行聚类,然后在部分受关注的子集中进行码值比较,从而有效的减少了需要考察的码值数量。为实现有效的泄密者追踪,一个能抵抗来自多个用户合谋攻击的数字指纹编码方法是必不可少的。提出了一种以基于BIBD (Balanced Incomplete Block Designs)码的分组正交码为内码,以纠错码RS (Reed-Solomon)码为外码的两层级联数字指纹码。设计了基于BIBD码的分组正交码,构造了内码矩阵,给出了内码的编码算法和性能分析,并说明了RS码的编码和译码方法。在此基础上,给出了级联码的编译码算法和性能分析,展示了指纹编码的有效性。通过与受研究人员关注的Boneh-Shaw码和Dittmann码在同等合谋状况下的码长对比,说明了所给编码方法可使用较短的码长达到同样的抗合谋攻击效果。给出了一个用于企事业单位内涉密图像的泄密检测与泄密者追踪的原型系统,说明了在网络环境中如何使用移动Agent来收集网络图像,如何依据网站的相关属性对待扫描网站进行关注度分级以及如何依据分级结果调整网站扫描调度策略,如何基于机构水印来快速检测嫌疑泄密图像以及如何利用图像特征匹配来定位嫌疑泄密图像的泄密源,如何利用基于BIBD码的分组抗合谋数字指纹算法快速排除大部分无辜用户并追踪到合谋者。此外,还给出了子机构划分和用户分组的原则与方法,并说明了对涉密图像预处理的过程。最后通过仿真实验展示了原型系统的可用性。通过对网络环境下用于涉密图像保护的泄密检测和泄密者追踪研究,取得了若干具有理论价值和实用价值的成果,对保护涉密电子图像文件的信息安全具有积极意义。