论文部分内容阅读
近年来,随着信息技术的迅猛发展,计算机和其它数字设备的使用量激增。与此同时,高科技领域的刑事犯罪和司法纠纷日益突出,这不仅给受害者造成了巨大的损失,对社会、国家安全、社会文化所带来的危害也不可估量。大量计算机犯罪案例的取证工作需要提取保存在数字设备中的数据。为了重现计算机犯罪的作案现场,找到犯罪分子的作案证据,就需要恢复已被删除、加密或破坏的文件,甚至需要在文件系统已遭破坏或丢失的前提下来恢复磁盘数据。因此,文件雕复技术作为一种无须凭借文件系统的文件恢复技术成为计算机取证领域中的重要研究课题之一,具有重要的理论价值和实际意义。JPEG作为当前最为流行的图像存储格式和数字摄影图像之一,颇受犯罪分子的“青睐”。对于JPEG文件的雕复引起了国内外众多研究者的关注。在对文件系统没有任何先验知识的前提假设下,本文针对如何解决在数据分片、失序情况下的JPEG文件恢复这一问题展开研究。首先,从文件系统开始介绍,阐明造成数据分片或者失序的原因。再深入细致地分析了现有各种JPEG文件雕复方法,如简单雕复、文件头/最大长度雕复、Smart雕复、双分片差距雕复、文件映射雕复、图理论雕复、依靠文件内部结构雕复等方法。在此基础上,通过总结现有文件雕复技术的局限性及面临的挑战,描述了JPEG文件雕复技术今后的发展方向应当结合多种文件雕复方法、充分利用JPEG文件的内部结构和内容特征知识,以及重视处理分片JPEG文件和头部破损JPEG文件的技术。其次,收集多方资料,深入分析JPEG文件的内部结构、内容特征和压缩编码过程,提出一种基于内容特征的JPEG文件雕复方法。其原理在图理论雕复的基础上,将文件雕复过程看成一个概率统计模型,并通过神经网络模型中误差反向传播算法构造匹配权重来计算两个数据块在原始文件中是否相临的概率。再次,为了进一步降低“误报率”,本文根据JPEG文件碎片的特殊性提出了一种基于轮廓线匹配的JPEG文件雕复。对上一章得到的候选匹配数据块进行解码,然后通过一系列处理得到图像物体的轮廓线描述,提取特征线段用以构造特征向量,再根据局部几何属性进行轮廓线匹配,从而达到再一次验证原数据块在原始文件是否相邻的目的。最后,为了证实上述雕复理论的可行性和有效性,将此方法应用于DFRWS 2006、2007年雕复难题挑战的数据集,设计了详细的实验步骤,阐述了相应的实验细节,最后对实验结果进行了全面的讨论和分析。实验结果表明该雕复方法能有效的在无结构的原始磁盘镜像中恢复完整连续、有序分片或无序分片的JPEG文件。