论文部分内容阅读
随着信息技术的不断发展,数据恢复作为计算机取证的关键技术是打击高科技信息犯罪的有力武器。传统的数据恢复技术面临着如何恢复遭到不可抗力或反取证技术等各种因素破坏的磁盘数据这一难题。文件雕复技术作为一种不依赖于文件系统元信息的数据恢复技术,有效弥补了传统数据恢复技术的不足,并成为计算机取证领域新的研究热点。
归档文件是广泛用以储存、传输和压缩数据的文件格式之一,它将多个数据文件组合成一个更易于存储和携带的单一文件,归档文件也自然成为一种计算机取证领域中重要的证据文件。因此对归档文件雕复技术的研究在计算机取证领域变的至关重要。本文从分析现有文件雕复技术的入手,通过充分挖掘归档文件内部结构和数据内容特征,研究基于结构和内容的归档文件雕复方法。通过对比实验的方法表明了本文提出的基于结构和内容的归档文件雕复方法的可行性和优越性。
首先,本文对现有的文件雕复技术进行了全面的分析与总结,如文件头/文件尾雕复方法、文件头/最大长度雕复方法、基于文件结构的雕复方法、基于块内容的雕复方法、基于映射函数的雕复方法、基于图论的雕复方法、二分片雕复方法、原地文件雕复方法和零存储雕复方法和Smart雕复方法等,并总结了现有雕复技术各自的优越性和局限性,最后给出了现有文件雕复技术所面临的挑战及今后的发展方向。
其次,本文通过对归档文件内部格式、数据内容的理解及压缩策略等全方面的分析,将归档文件分为非固实压缩归档文件和固实压缩归档文件两类。深入挖掘分析两类归档文件在结构和内容层面的特征,提出了非固实压缩文件局部二分片,非关键部位数据损坏或丢失及残存数据的雕复问题的解决办法,提出固实压缩文件二分片及非关键部位数据损坏或丢失的雕复问题的解决手段。
再次,提出一种基于结构和内容的非固实压缩归档文件雕复算法总体框架,利用映射函数来定位归档文件中一个文件的文件头和文件尾,利用数据长度来鉴别被归档文件是否发生分片,利用枚举探测法鉴别数据分片点,利用解压缩的方式验证数据块的正确性,利用文件的内容及结构特征验证文件的完整性和有效性,修复结构残缺或无效的归档文件。本文将非固实压缩文件雕复算法应用于Rar和Zip类文件的雕复。通过在人工数据集和实际磁盘数据集上的对比实验,表明算法在雕复时间、恢复文件数目及雕复准确率三者的综合表现上较其他雕复方法有明显优势。
最后,在研究非固实压缩归档文件雕复方法的基础上,基于固实压缩归档文件结构和内容特征,提出一种固实压缩归档文件雕复方法。同样利用映射函数来定位一个固实压缩归档文件的文件头和文件尾,利用数据长度来鉴别归档数据是否发生分片,通过观察滑动窗口熵值变化以及枚举解压来定位分片点,借助结构及内容层面的特征来验证固实压缩归档文件的完整性和有效性,通过解压测试寻找最多可解压数据的方式解决文件非关键部位损坏或丢失问题。本文将固实压缩文件雕复算法应用于7z类文件的雕复。解决了7z文件二分片,非关键部位数据损坏或丢失的雕复问题。通过在实际磁盘数据集上的对比实验,表明本雕复算法与同类算法相比具有更好的自动性和准确性。
综上,本文针对现有文件雕复技术存在的问题,提出了基于文件内部结构和数据内容特征的归档文件雕复方法,并通过实验证明其可行性和有效性。本文的研究成果为进一步发展文件雕复技术提供了新思路,也为实现实用的文件雕复系统打下基础。