电子文档安全性检查关键技术研究

来源 :北京化工大学 | 被引量 : 0次 | 上传用户:laq_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在信息时代,数据是企业重要的资产,防范数据资产泄漏是意义重大的课题。本文立足于数据防泄漏保护的研究,旨在构建一个检查文件安全性的有力工具,阻止敏感数据的泄漏。为此,本文对其中的一些关键技术进行了研究,包括对文档分类技术和文档结构检查技术的研究。为了提高安全检查中对文本文档安全性分析的准确率,本文引入了文本分类技术,并对传统的特征选择算法tf-idf做出了改进。tf-idf算法在计算文档频率时将所有文档视为一个整体,并未考虑分类区别的影响。对此,本文提出了新的tf-DE算法,通过引入类间离散度和类内信息熵的概念,分别度量特征词在类间和类内的分布情况,克服了tf-idf算法的不足。通过实验研究,在与其他8种常用算法的比较中,tf-DE算法均表现出不同程度的优势,是一种更高效的特征选择算法。为了防范基于文件结构的信息隐藏手段,本文对一些常见的文档结构进行了分析研究。其中,对Microsoft Office文档,我们设计了防范额外文件嵌入、图片嵌入、OLE嵌入等隐藏手段的策略。另外,基于文件结构知识,我们还设计了文件类型验证和文件收尾点检查策略。基于以上研究工作,本文设计并实现了文件安全性检查系统,系统支持多种基于文件结构的信息隐藏方法的检测,以及对图像隐写的主动攻击和基于文本分类技术的文本类别检查功能。
其他文献
在我国现行的热网运行系统中,由于必要参数监测手段的缺少,导致了无法对系统的运行状况进行分析判断。为了及时了解现场工况,特别是针对一些零散和无人值守的现场,需要实时采集现
近年来,随着我国经济飞速发展,城市化进度加快,城市的规模急剧扩大,城市人口数量急速增加,现有的城市交通已经无法满足城市发展的要求。减轻城市交通压力,提高城市交通能力,轨道交通
将面向方面思想引入Web服务后,可以通过定义方面将关注点从基本流程中抽象出来,提高流程定义的模块性,再使用编织技术集成,在运行时动态激活和撤销方面以适应需求的变化。用户对
随着互联网应用技术的不断发展,网络在带给人们方便的同时,其安全隐患也日益突出。现有的网络安全技术主要集中在数据加密、防火墙以及入侵检测等方面,虽然这些技术能够有效的抵
全球信息化的程度越来越高且越来越快,每天产生的数据量已经难以估计,BigData的研究主题成为了国家战略重点之一,未来是一个数据的时代。本课题主要关注互联网数据,为特定场
随着计算机技术的发展,计算机技术成为各个行业提高生产效率的关键技术。人们在享受各种计算机技术带来便捷的同时,也面临着日益严峻的信息安全形势。由于冯诺依曼体系结构的计
图像采用和传输技术应用十分广泛,如消费电子、工业控制、交通道路、军事国防、医务医疗等领域。传统的图像采集与传输系统由PC机以及图像采集设备组成,通过专有的有线网络来传
嵌入式Linux操作系统作为一款免费的操作系统,具有可裁减、支持多用户、能独立运行等特点,得到了很广泛的应用。本课题选用的图形用户系统是MiniGUI,是北京飞漫公司开发的一
人体运动捕获是计算机视觉研究领域的重要课题之一,也是近年来备受研究者关注的前沿方向。本文集中研究基于数据库的运动技术进行人体三维重建,包括对动作的检索和查询和动作数
基于物理的流体模拟一直是计算机图形学中的热门研究领域之一。其中,烟雾模拟因其重要的应用价值,更是成为了人们研究的重点。它广泛应用在游戏引擎、影视特效、灾难场景的模拟