基于深度学习的数字取证中文件碎片类型检测算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:zx1q1q1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数字取证是信息安全领域的重要研究内容之一,并广泛应用于刑侦取证和司法取证等领域。在刑侦取证领域中,需要提取嫌疑人的各类图片、音频、文字等数字化的文件用于对嫌疑人的犯罪事实的判别。然而刑侦取证和司法取证过程中的数字信息往往是不完整或者被恶意损坏的,高效的雕复这些文件的重要前提就是正确地检测文件碎片类型。提高文件碎片检测准确率,进而就能提高文件雕复的速度,从而优化数字取证的过程。然而,数字取证中文件碎片类型检测算法的研究,存在两个主要难点问题,其一是由于嫌疑人的恶意破坏或篡改,使得原始文件常常丢失文件元信息,使文件碎片类型检测的准确率降低;其二是压缩或者复合的高熵文件类型具有高度相似的统计学特征,使类型检测难度加大。本文针对上述两个难点问题,提出了基于深度学习的数字取证中文件碎片类型检测算法。传统的机器学习,通过人工提取N-Gram,香农熵或汉明权重等特征来实现文件碎片类型检测。由于这些方法在特征提取中更偏向于统计学特征,对结构特征考虑较少,故其文件碎片类型检测中的准确率并不高。本文首先对公共数据集进行去除文件元信息的预处理,使原始数据集的类型检测更具有挑战性,并复现了基于人工特征提取与支持向量机相结合的算法对文件碎片进行类型检测。随后提出了一种基于文件碎片灰度图像转换和深度学习的新方法,将二进制数据映射到图像空间中为了提取更多的隐藏特征,从而提高分类的准确性。受益于多层特征映射的优越,我们的卷积神经网络结构可通过神经元之间的非线性连接提取近十万个特征。本文将提出的基于数字图像灰度转化和深度学习的文件碎片类型检测算法在公共数据集Gov Docs上进行了训练和测试,最终取得了良好的实验结果。
其他文献
妇好鸮尊是商代殷墟妇好墓成对出土的祭祀礼器,是殷商时期动物造型青铜器中独具特色的精品;从鸮尊的历史背景展开,对其艺术特征从造型、纹饰两方面进行分析。梳理古代鸮崇拜
针对目前大直径暗立井施工存在的效率低、安全性差等问题,提出了反井一次成井工艺。介绍了反井钻机设备选型、施工现场布置、井下运输与安装、导孔与扩孔钻进等施工过程及注
一个百亿级的农资市场正在形成,未来甚至具备超过十倍的增长潜力。$$“虾稻共作”,一个集农民增收、循环种植、生态农业等各类时尚标签为一体的“古老产业”,正成为农资企业竞争
报纸
随着服务业在社会经济中的重要性与日俱增,服务设计正在受到广泛的关注。服务接触是指顾客与服务系统之间的动态交互过程,既包括顾客与服务人员之间的互动,也包括顾客与设施
"麦克米伦缺口"一直阻碍着中小企业的发展,而众筹以其平民化、草根化的特点开启了新一轮中小微企业融资方式新变革。互联网众筹在快速兴起的同时,也带来了不少风险。文章通过
<正>黄渤,中国著名男演员、金马影帝。1974年出生于山东青岛,毕业于北京电影学院表演系配音专业。黄渤早年曾有过驻唱歌手、舞蹈教练、影视配音等多种工作经历。2006年,因主
本文试图通过解析在进行设计活动时的手法——即注重形与义之间的关系来探讨中国当代设计,并以品物流形的家具设计为例来验证"器以载道、蕴情契形"这一造物法则可以让我们更
以地域社会学的理论为指导,运用文献资料、田野调查和逻辑分析等研究方法,对崇礼区社会样态生发的动力机制和特征进行研究。研究认为,崇礼区社会变迁是滑雪产业集聚的结果,是
<正>曾经,网上流传这样一种说法:我们这代人,天生就是吃地沟油的命。不过,小编始终相信,命由天定,势由己造,我们改变不了社会的大气候,但生存的小环境改造起来大约还是绰绰有
电子商务的发展引起了人们对电子合同缔约主体资格的关注。由于电子合同缔约过程的特殊性,未成年人在缔约制度中不应享有与传统合同中同样的特殊保护。