论文部分内容阅读
随着计算机技术的发展和各种电子信息交互活动在现实生活中的不断深入,计算机犯罪的类型和领域也在增加和扩大。目前大规模的数字取证调查至少存在两个基本挑战。第一是如何满足海量证据处理的计算需求,第二是如何从原始数据中自动提取出有用的信息。这两个问题导致处理时间长,严重妨碍了取证调查。
Hash检验是计算机取证分析的重要手段之一,使用该技术可高效识别已知文件。然而,多年来Hash技术基本用途没有很大的改变。本文设计一种有效的和可扩展的Hash方法,相对传统Hash对原始数据处理的方法,该方法能够保留足够的信息来检测数据对象的相似性。
首先,针对上下文触发分片Hash算法在处理多数据对象时会造成文件指纹的存储空间较大,并且对指纹序列性敏感的等问题,本文借鉴BloomFilter在数据压缩中的应用,提出了一种基于Bloom Filter的多分片级证据获取方法。该方法能够生成一个有效的、可扩展的Hash指纹,能够在不同的粒度上检测数据对象的相似性,取消了对指纹序列性的限制。实验结果表明,该方法在识别能力方面得到提升。
其次,传统的图像获取方法不能有效的反映人眼对图像的视觉感知,感知Hash是以图像感知特征为不变量,根据人类视觉系统的特点,符合人类感知模型。本文把感知Hash引入计算机取证领域,设计了一种基于感知Hash的图像证据获取方法。
最后,设计完成了基于Bloom Filter的证据获取工具。该工具可以在不同的粒度上检测同源文件能力,较为准确地定位证据文件。同时设计完成了基于感知Hash的图像证据获取工具,该工具对JPEG压缩、低通滤波、缩放和旋转等操作有良好的鲁棒性,提高了图像证据获取的识别率。