基于文件签名的FAT32文件恢复技术原理与实践

来源 :计算机时代 | 被引量 : 0次 | 上传用户:Air8712
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.015
  摘  要: 文件恢复对电子取证行业非常重要,而文件签名恢复文件是一种常用的文件恢复方法。其过程是,搜索文件签名以确定文件起始扇区号;根据文件签名尾或大小来估算文件的结尾扇区号;把起始和结尾扇区之间的内容复制生成一个新文件即可得到被删文件。如果文件在数据区中是连续存放的,该恢复方法的成功率非常高。文章以FAT32文件系统为例,把一个JPG文件彻底删除,再借助WinHex软件成功地对其进行恢复。
  关键词: 文件删除; 文件恢复; 文件签名; 文件类型; 扇区
  中图分类号:TP3          文献标识码:A    文章编号:1006-8228(2021)11-60-03
  Principle and practice of file signature based file recovery technology
  Wang Chunlan
  (School of Evidence Science, Gansu University of Political Science and Law, Lanzhou, Gansu 730070, China)
  Abstract: File recovery is very important to the electronic forensics industry, and file signature based file recovery is a common file recovery method. Its process is to search the file signature to determine the file starting sector number; Estimate the end sector number of the file according to the signature tail or size of the file; The deleted file can be obtained by copying the contents between the start and end sectors to generate a new file. If the file is stored in the successive sectors, the success rate of this recovery method is very high. In this paper, taking FAT32 file system as an example, a JPG file is completely deleted, and then be successfully restored with the help of WinHex software.
  Key words: file deleting; file recovery; file signature; file type; sector
  0 引言
  隨着计算机和电子产品的普及,计算机犯罪现象越来越多,不法分子在作案时会将犯罪“痕迹”留在计算机或移动存储介质中,这里的“痕迹”就是指数据。为了逃避惩罚,他们会使用各种各样的高超“去痕”技术抹去在犯罪过程中留下的数据痕迹。这就需要电子取证人员通过数据恢复来重现犯罪分子所留下的作案证据[1]。如今整个社会对电子证据的重视程度不断提升,电子取证的地位越来越重要,其中基本手段之一的数据恢复技术,对收集犯罪证据有极大帮助[2]。虽然目前计算机磁盘默认采用NTFS文件系统,但是移动存储介质在计算机犯罪案件中很常见,而移动存储介质通常采用FAT32文件系统,所以电子取证工作中FAT32文件系统中的数据恢复需求非常旺盛。
  本文对FAT32文件系统中被彻底删除的文件进行恢复。采取的方法是根据文件签名来手动恢复文件。
  1 文件签名
  文件签名即文件头,是位于文件开头的唯一标识号。文件签名标识文件真实类型[3]。有相当一部分文件类型的文件签名既有开头,又有结尾,所以很容易找到文件的起止存储位置,从而恢复出整个文件。
  以RAR压缩文件为例,其特有的文件签名为“52 61 72 21”字节段。也正是通过这个字节段,我们能准确解读并判断它是RAR格式的文件。其他各种文件类型的文件签名都有自己的数值,有的长些,有的短些,有的在文件的开头,也有的可能在文件的中间或结尾,也就是相对于文件开始有一定的偏移,有的文件格式有文件签名头部和尾部,如常见的JPG图像,其签名头部是FFD8,签名尾部是FFD9。一般情况下,我们在一个文件开头发现了某段签名,就可以判断它是什么格式的文件了[4]。
  2 FAT32文件系统结构与数据删除
  为了弄清楚数据恢复的思路,我们需要先明白FAT32文件系统的结构以及该文件系统在删除数据时的操作细节。
  2.1 FAT32文件系统结构
  如图1所示,FAT32文件系统由保留扇区、FAT表、DATA区组成[5]。其中保留区中所含的DBR扇区称为引导扇区,里面包含了文件系统的重要参数比如保留区的大小(扇区数),FAT表的大小(扇区数),分区根目录在DATA区中的簇号等。
  FAT表有两份,FAT2是FAT1的备份。FAT表可以告诉我们数据区中哪些簇是空闲的,可以被再分配。DATA区被划分为一个个簇,用来存放文件和文件夹(目录)的内容。如果某个簇是用来存放文件的,则该簇里存放的文件的内容,如果某个簇是用来存放文件夹,则该簇空间被分为一个个长度为32字节的目录项,目录项用来描述该文件夹的子对象(子文件或子文件夹)的基本信息,如名称、常规属性、起始簇号等,其中名称存放在目录项的起始位置。   2.2 文件系统如何进行彻底删除
  在建立文件时,会在该文件的父文件夹中给该文件分配目录项,对该文件进行登记,然后给该文件分配DATA区的簇,同时在FAT表中相应簇的FAT表项处登记该簇已被分配,把文件内容写入所分配的簇中。所以建立文件时文件系统做了三件事:在父目录的目录项中登记,在FAT表项中标记簇已分配,在簇中写入文件内容。
  但是,在彻底删除文件,文件系统只做两件事,第一是把该文件在父文件夹中的目录项的第一个字节改成E5H,代表该子对象已被删除,第二是根据目录项找到该文件的起始簇号,到FAT表中把该文件所占的所有簇的FAT表项都清零,表示这些簇都变成未分配状态。为了整体读写速度考虑,这些簇中所存放的文件内容并没有做任何操作,所以这种删除文件的操作策略,为我们做数据恢复提供了便利。
  快速格式化的操作思路与彻底删除单个文件基本一致,区别在于快速格式化时,文件系统会对该分区的所有文件进行彻底删除。
  3 基于文件签名的数据恢复实践
  3.1 文件恢复前的准备工作
  新建一个虚拟磁盘,初始化后格式化成FAT32分区。然后在根目录中放入一个TIKTOK.JPG文件,然后把该文件彻底删除。下面开始用基于文件签名的方法来恢复它。
  要恢复该文件,必须知道该文件内容的起始扇区和结束扇区。要恢复的对象是JPG文件,有文件签名头部FFD8和尾部FFD9,所以用WinHex打开该分区,在DATA区,搜索文件签名头部和尾部来定位文件内容。首先要定位到DATA区起始位置。
  从图2该分区的引导扇区可以知道,该分区前隐藏扇区有128个扇区。而该Fat32分区的保留区有6646个扇区,每个FAT表的大小为773个扇区,根目录在DATA区的2号簇(因为特殊原因,DATA区的簇以2开始编号),所以128+6646+773*2=8320号扇区是根目录的起始扇区。
  3.2 根据文件签名进行数据恢复
  前面确定了DATA区起始扇区号为8320,在Winhex中跳转到该扇区,根据要恢复的文件是JPG类型,可以搜索其文件签名头FFD8(图3),如图4所示在8336号扇区的开始位置搜到了FFD8。
  右键选取FF所在字节,选择“选块开始”。
  然后搜索JPG文件的文件签名尾FFD9,如图5所示在第8392号扇区找到了FFD9。
  大致估算这块数据的大小为(8392-8336+1)*512B=28KB,跟文件大小基本相符,于是,在FFD9的位置右键选择“选块结尾”,文件内容就被全部选中,然后右键点击编辑——复制选块——置入新文件,给该文件命名,注意要手动输入后缀名JPG,保存到某个位置。然后打开该文件,看到文件被成功恢复,如图6。因为文件名保存在根目录的目录项而不是文件数据存储簇中,所以按此恢复方法只可得到文件内容。
  如果对分区进行了快速格式化,文件系统也会把所有文件的FAT表的对应位置和所在目录的目录项进行修改,但是数据区中的文件内容也同样没有进行擦除。所以,也可以用同样的基于文件签名的方式进行数据恢复。
  在进行文件恢复时,如果所要恢复的文件类型没有文件签名尾,那就需要借助文件大小来估算文件存储的结尾位置。比如本例中,该文件的大小为28KB,那么根据一个扇区为512B的经验,可以推算该文件应该占用28KB/512B=56个扇区,而根据所搜到的文件签名头在8336号扇区,就可以知道文件内容结尾位置应该是8336+56=8392号扇区,也可以顺利恢复文件。
  另外,在搜索文件签名头部时,为了避免有其他并不是文件签名头的“FFD8”被误当作文件开始,还可以借助FFD8是否出现在簇的开始位置来判断、借助FFD8和FFD9之间的数据量是否与文件大小相符合来进行判断。另外,如果该文件的目录项没有被新文件的目录项覆盖,还可以搜索目录项来获取起始簇号再去计算起始扇区号。如果有多个FFD9,也可以用FFD8和FFD9之间的数据量是否与文件大小相符合来进行判断。如果无法判断,则可以逐个导出尝试性恢复。
  4 结束语
  因为嫌疑人会故意删除犯罪证据,所以在电子取证工作中,恢复数据是非常重要的,而目前很多移动存储介质均采用FAT32文件系统,本文对FAT32文件系统中已被彻底删除的文件进行了恢复。根据文件签名头部找到该文件内容的起始位置,然后再根据文件签名尾部,找到文件内容的结束位置,就可以把该文件内容完整地恢复出来。如果要恢复的文件类型只有文件签名头,没有文件签名尾,可以根据文件的大小来估算文件内容存放的结束位置。所以,在文件连续存放的前提下,只要文件的内容没有被新文件覆盖,恢复的几率是非常高的。有些个别的文件类型没有文件签名,则不能使用本文的恢复方法。
  如果FAT32文件系统中文件存储有碎片,则需要根据文件的结构特征、数据的关联来进行恢复,这种情况的文件恢复会困难很多。
  参考文献(References):
  [1] 張明旺,侯智文.数据恢复技术在涉案计算机侦查取证中的应用研究[J].科技创新导报,2018.15(6):170-173
  [2] 戴士剑,涂彦晖.数据恢复技术(经典重现版)[M].电子工业出版社,2014.
  [3] 张婷婷.试论计算机取证中的数据恢复技术[J].科技风,2017.5:61
  [4] 胡敏,杨吉云,姜维.Windows下基于文件特征的数据恢复算法[J].计算机应用,2011.31(2):527-528
  [5] 张化军,王恩辉,刘晓燕.FAT32文件系统误删除数据恢复[J].包头职业技术学院学报,2013.14(2):21-23,31
其他文献
针对水车驱动生物转盘(wdRBC)存在的短流问题,提出了在接触槽内增设折流板的措施加以改进,运用示踪剂NaCl脉冲响应试验,研究改进前后反应器水力特性,并采用快速排泥法启动折流板水车驱动生物转盘(wdbRBC).结果表明:在同一水力停留时间(hydraulic retention time,HRT)下,改进后的反应器死区率降低,由35.29%、28.83%下降到3.10%、8.19%,水力流态明显改善,N值由2.03、2.78提高到7.77、5.78,Pe值由2.64、4.27增大到14.47、10.45
城市水处理行业在输送、运行过程中会产生大量碳排放,在我国2030年实现碳达峰、2060年实现碳中和的目标前提之下,有必要对全链条碳排放情况进行评估分析.评估有助于从碳减排角度对各环节现有的技术设备进行升级改造或者替换,为最终实现碳中和目标做出贡献.文章旨在分析城市水系统从水源地到各个环节的碳排放情况,根据对各环节核算边界的界定与研究,找到影响碳排放的主要因素.并根据定性分析结果,可以得到包括电耗、能耗在内的间接排放是城市水系统碳排放的主要来源,为后续完成供排水系统全链条碳排放核算提供理论依据,并根据分析结
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.008  摘 要: 单通道信号源个数估计是单通道盲源分离问题的前提与难点,传统方法无法直接进行估计且准确率较低。文章提出了一种基于深度网络分类器的单通道信号源估计方法。该方法将源个数估计作为分类问题,在经典CNN的基础上引入一维卷积网络与残差结构作为分类器,采用短时傅里叶变换和梅尔倒谱系数作为联合特征输入分类器。在L
砷、氟污染水体及其共存问题是环境领域的热点问题,长期暴露其中对公众的身体健康存在巨大威胁.文章梳理了砷、氟污染物的来源,及砷、氟污染水体的分布与危害,并按吸附、离子交换、反渗透、电絮凝、膜法等分析了用于砷、氟处理的各类技术手段的利弊,以期为后续水体中砷、氟污染物的高效去除提供参考.
2020年6月,美国教育部国家教育统计中心推出了报告《数据治理指南》.该报告可以为大数据时代我国教育数据治理发展提供一定的借鉴与启示.通过对该报告的深入分析,发现报告具有如下特色:报告是美国教育数据治理最新成果与理论的发展;明确教育数据治理是一个系统工程,贯穿于教育数据的整个生命周期等.报告提出的观点及案例可以给我国大数据时代教育数据治理提供一定的启示与参考.
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.017  摘 要: 为了在学分制下提高离散数学课程的教学效果,阐述了离散数学课程的基本特点,分析了在完全学分制下该课程面临的新的挑战和问题,提出课后辅助教学将成为影响整体教学效果极为重要的因素的观点。文章对利用互联网、增加自主小测验、增加大作业模块以及改进考核机制四个方面的课后辅助教学方法进行了初步探讨。  关键词:
Massive ocean data acquired by various observing platforms and sensors poses new challenges to data mana-gement and utilization.Typically,it is difficult to find the desired data from the large amount of datasets efficiently and effectively.Most of existi
DOI:10.16644/j.cnki.cn33-1094/tp.2021.11.005  摘 要: 传统RSSI测距模型在移动机器人对使用者进行定位时存在依赖环境参数和不能辨别目标方位等问题,因此提出一种基于BP神经网络的测距定位方法。该方法采用了RSSI测距模型和超声波测距模型,利用测距定位模块收集到的RSSI值与超声波数据作为输入对BP神经网络进行训练。实验结果表明,该方法有效地解决了传统R
随着城镇化的高速发展,城市边缘不断向外扩张,地上污水处理厂普遍存在处理能力不足和臭气、噪声等二次污染的邻避效应的问题.地下污水处理厂具有占地空间小、环境友好、土地综合利用价值高等优势,在我国城市水环境保护和城市可持续发展中发挥着重要的作用.文中通过研究国内地下污水处理厂的关键技术和工程案例,分析地下式污水处理厂的技术特征和亟待解决的难题,为地下污水处理厂的建设提供技术参考.
竹园污水处理厂四期工程建成后,进水量可能长期处于设计规模的30%~90%.因此,设置了进水量为设计规模40%和70%的低流量组和高流量组厌氧-缺氧-好氧(anaerobic-anoxic-oxic,AAO)中试反应器,用以模拟典型工况,从而为竹园四期工程和竹园片区的水量调度提供理论依据.在约2倍污泥龄的运行周期中,低流量组和高流量组反应器出水化学需氧量(COD)和氨氮浓度可稳定达到一级A标准;高流量组出水总氮(TN)浓度可稳定达到一级A标准,略优于低流量组;两组出水总磷(TP)浓度均无法达到一级A标准,建