归档文件雕复方法的研究

来源 :杭州电子科技大学 | 被引量 : 0次 | 上传用户:aspiis6sql
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的不断发展,数据恢复作为计算机取证的关键技术是打击高科技信息犯罪的有力武器。传统的数据恢复技术面临着如何恢复遭到不可抗力或反取证技术等各种因素破坏的磁盘数据这一难题。文件雕复技术作为一种不依赖于文件系统元信息的数据恢复技术,有效弥补了传统数据恢复技术的不足,并成为计算机取证领域新的研究热点。   归档文件是广泛用以储存、传输和压缩数据的文件格式之一,它将多个数据文件组合成一个更易于存储和携带的单一文件,归档文件也自然成为一种计算机取证领域中重要的证据文件。因此对归档文件雕复技术的研究在计算机取证领域变的至关重要。本文从分析现有文件雕复技术的入手,通过充分挖掘归档文件内部结构和数据内容特征,研究基于结构和内容的归档文件雕复方法。通过对比实验的方法表明了本文提出的基于结构和内容的归档文件雕复方法的可行性和优越性。   首先,本文对现有的文件雕复技术进行了全面的分析与总结,如文件头/文件尾雕复方法、文件头/最大长度雕复方法、基于文件结构的雕复方法、基于块内容的雕复方法、基于映射函数的雕复方法、基于图论的雕复方法、二分片雕复方法、原地文件雕复方法和零存储雕复方法和Smart雕复方法等,并总结了现有雕复技术各自的优越性和局限性,最后给出了现有文件雕复技术所面临的挑战及今后的发展方向。   其次,本文通过对归档文件内部格式、数据内容的理解及压缩策略等全方面的分析,将归档文件分为非固实压缩归档文件和固实压缩归档文件两类。深入挖掘分析两类归档文件在结构和内容层面的特征,提出了非固实压缩文件局部二分片,非关键部位数据损坏或丢失及残存数据的雕复问题的解决办法,提出固实压缩文件二分片及非关键部位数据损坏或丢失的雕复问题的解决手段。   再次,提出一种基于结构和内容的非固实压缩归档文件雕复算法总体框架,利用映射函数来定位归档文件中一个文件的文件头和文件尾,利用数据长度来鉴别被归档文件是否发生分片,利用枚举探测法鉴别数据分片点,利用解压缩的方式验证数据块的正确性,利用文件的内容及结构特征验证文件的完整性和有效性,修复结构残缺或无效的归档文件。本文将非固实压缩文件雕复算法应用于Rar和Zip类文件的雕复。通过在人工数据集和实际磁盘数据集上的对比实验,表明算法在雕复时间、恢复文件数目及雕复准确率三者的综合表现上较其他雕复方法有明显优势。   最后,在研究非固实压缩归档文件雕复方法的基础上,基于固实压缩归档文件结构和内容特征,提出一种固实压缩归档文件雕复方法。同样利用映射函数来定位一个固实压缩归档文件的文件头和文件尾,利用数据长度来鉴别归档数据是否发生分片,通过观察滑动窗口熵值变化以及枚举解压来定位分片点,借助结构及内容层面的特征来验证固实压缩归档文件的完整性和有效性,通过解压测试寻找最多可解压数据的方式解决文件非关键部位损坏或丢失问题。本文将固实压缩文件雕复算法应用于7z类文件的雕复。解决了7z文件二分片,非关键部位数据损坏或丢失的雕复问题。通过在实际磁盘数据集上的对比实验,表明本雕复算法与同类算法相比具有更好的自动性和准确性。   综上,本文针对现有文件雕复技术存在的问题,提出了基于文件内部结构和数据内容特征的归档文件雕复方法,并通过实验证明其可行性和有效性。本文的研究成果为进一步发展文件雕复技术提供了新思路,也为实现实用的文件雕复系统打下基础。
其他文献
3DTV作为下一代视频技术的研究热点,其关键技术包括三维图像的获取、编码、传输、解码/合成和显示五个方面。本论文旨在以FPGA作为平台,对三维立体电视中所要使用到的若干关
当前,科学与工程计算中大规模数据处理的需求与日俱增。与此同时,高性能并行机的发展和硬件价格的下降使得高性能机器得到了广泛推广,与之相伴的是各种并行编程模式和并行编程语
快速而准确地提取蠕虫特征对于有效防御多态蠕虫的传播至关重要。通常对蠕虫攻击的防御都是在其对网络造成了较大的危害之后才开始进行的,对于蠕虫的响应速度滞后于蠕虫的传播
客户管理系统的建设目标是利用现有的网络和通信资源、建立起以数据库为核心的应用管理平台,灵活地利用现有通讯技术,适应日益增长的通讯需求,努力构建一个快捷、开放、灵活
基于特征码的病毒检测方法在面对已知的恶意软件时拥有很高的检出率和极低的误报率,然而该方法只关注特定恶意软件的特定指令序列,却忽略了程序的功能特征,因此无法检测到未知的
掌纹识别技术是指通过人体手掌的有效信息对个人身份进行鉴别,由于人的掌纹具有唯一性,根据这一特点,掌纹可以被用作人体的身份识别,它被认为是当今高度互联的信息化社会的高
膜生物反应器(MembraneBioreactor,简称MBR)的计算机仿真已经成为当今MBR模拟仿真的研究热点。MBR计算机仿真从当初单一的模拟仿真转变为数值仿真、模拟仿真以及图形仿真相结
本文以中国南极科考队的天文望远镜AST3的图像处理系统的设计、开发和实现为基础,实现了可配置易升级的天文望远镜软件处理系统。本文描述的系统搭建了处理AST3望远镜拍摄所
万维网Web应用软件在中国目前正在飞速增长,在我国,很多Web应用只适用于IE浏览器,实现Web应用的跨浏览器成为一个重大的现实问题。W3C组织制定的规范是保证Web应用能够实现跨
基于多核处理器的景像织物CAD软件已经成为纺织领域的一个重要研究方向,基于多核处理器的景像织物CAD软件运用粒子群颜色量化算法以及OpenMP多线程并行技术有效的解决了真彩色