论文部分内容阅读
为了打击日益猖獗且手段高超的计算机犯罪活动,我国在诉讼法领域先后出台了各种政策,确保电子据成为一项有效的法律证据。然而,为了逃避数字取证调查,犯罪嫌疑人可能采用隐藏、删除、格式化等手段来抹除电子证据。为了重现电子证据,取证人员需要文件恢复技术。传统的文件恢复技术利用文件系统信息进行文件恢复。当文件系统不可用时,传统的文件恢复技术将失效。针对该问题,文件雕复技术孕育而生。文件雕复通过分析文件的格式和内容来恢复文件,而不依赖于文件系统,得到了数字取证研究领域的重视。同时,由于图像文件是最常用的文件类型之一,本课题研究图像文件雕复问题以服务于数字取证调查。本文的主要研究工作和创新点包括以下几个方面。(1)针对基于图的图像文件碎片重组算法计算复杂度高的问题,提出了一种文件格式约束的剪枝算法,提升了图像文件碎片重组的准确度与速度。基于图的图像文件碎片重组算法适用于图像文件数据完整的场景,其将K图像文件重组问题视为有向完全图的K顶点不连通路径问题。该问题为NP完全问题。以BMP文件类型为例,我们将填充字节约束作为剪枝条件,排除了完全图中的大部分不可能路径。以8种经典的基于图的算法为例,实验结果表明,提出的方法通常可裁剪掉98%以上的不可能连接边,算法准确度提高32%到55%,运行时间降低为原算法的1/6到1/428。(2)针对基于图的图像文件碎片重组算法中的权重计算问题,本文对现有的权重度量算法进行了三方面的优化。这些优化分别针对权重计算过程中的不同问题,可互为补充,共同改善重组算法的性能。首先,我们理论证明了MED度量算法不能有效地区分两个数据簇的相邻性并给出了解决措施,即优化预测像素集合。实验结果表明优化后的MED算法准确度至少提升了39.10%。其次,观察到经典的So D度量算法和ED度量算法对突变像素敏感,通过引入数据突变鲁棒算子,提升了这两种度量算法的性能。实验结果表明改进后的So D算法准确度至少提升了3.98%,改进后的ED算法准确度至少提升了2.95%。最后,观察到图像文件数据簇中的非图像数据对重组算法具有较大的性能影响,我们通过定位这些非图像数据的位置并禁止这些数据参与权重计算,克服了该问题。以So D算法为例,实验结果表明,改进后的So D算法准确度至少提升了1.79%。(3)针对JPEG文件头数据簇损坏或丢失情况下的图像宽度估计问题,提出了一种更高准确度的基于图像像素的图像宽度估计算法。首先,本文在两个数据集上对现有宽度估计算法进行了全面比较,评估结果表明最好的基于像素的算法的性能总是优于最好的基于量化DCT系数的算法的性能。其次,针对如何使得基于像素的算法在量化表缺失的情况下仍然保持良好性能的问题,本文评估了利用标准量化表代替正确量化表将量化DCT系数转化为像素对该类算法性能的影响。评估结果表明,在该替换下,最好的基于像素的算法的性能仍然优于最好的基于量化DCT系数的算法的性能;同时,该替换对基于像素的算法的性能影响不大。由以上两个评估结果知,我们只需要研究基于像素的宽度估计算法。最后我们提出了一种新的基于像素的图像宽度估计算法,其主要思想是寻找垂直方向上相邻的MCU对,并根据MCU对得到候选宽度,将出现频次最高的候选宽度作为估计的图像宽度。实验结果表明,当大部分MCU块被恢复时,提出的算法通常具有最好的性能。(4)针对现有的重组图像文件质量评估算法的二值评估结果不能有效地反映重组图像文件质量的问题,本文提出了一种具有连续评分的重组图像文件质量评估算法。提出算法为每个重组图像文件赋予一个0到1的分数,分数值越高表明重组图像文件质量越好。提出算法的基本思想是:将重组图像文件的质量评估分解为计算重组图像文件中每个数据簇对原始图像信息的贡献。每个数据簇的贡献根据两个预先给定的规则逐步推导计算得到。通过29名主观观察者对588个重组图像文件质量进行评分的主观实验,并计算客观分数与主观分数在CC、SROCC、OR以及RMSE等指标方面的一致性,我们验证了提出算法的有效性。同时,主观实验结果也表明现有图像质量评价方法在图像文件质量评估方面性能不佳。(5)针对图像感兴趣区域的重组质量评估问题,本文提出了一种面向感兴趣区域的重组图像文件质量评估算法。首先我们利用提出的基于稀疏表示的参数自适应目标分割算法得到原始图像的分割结果。其次我们将该分割结果从文件数据层迁移到重组图像中,并通过评估重组图像的目标连通区域对原始图像目标区域信息量的贡献,给出了重组图像文件的质量评分。实验结果表明,提出算法的评估结果与人类主观观察一致。综上所述,本文对图像文件雕复中图像文件碎片重组问题、JPEG图像宽度估计问题、重组图像文件质量评估问题进行了深入研究,提出了相应的方法和技术方案,取得了较好的效果。