PDF文档的安全性检测技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:journey88
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,PDF文档格式作为一种电子文件的常见格式,已经得到了广泛使用。自2008年Adobe Reader被发现出第一例关键漏洞(CVE-2008-2549)以来,越来越多的PDF文件已经成为攻击的重要手段。但与其他的JavaScript的攻击方式相比,基于PDF的攻击在研究中并没有引起大量的关注,在此背景下,有必要开展对PDF文档的安全性检测的研究。本文首先介绍了开展PDF文档安全性研究的背景和发展现状,从纯静态检测、纯动态检测和动静结合的检测模式三方面对目前的研究状况进行了介绍和分析。接着介绍了PDF文档的格式和PDF文档的安全性问题,对每个部分的构成进行了详细的阐述和介绍。在PDF文档的安全性上,对PDF文档中的JavaScript模块进行了展开分析,此部分是PDF文档的安全性问题的基础和重点。在静态检测方面,本文介绍了静态检测PDF文档安全性的原理和对静态检测方案进行了改进和实现。首先是从PDF文档中对JavaScript代码进行提取,通过在提取过程中加入一定的反混淆(deobfuscate)措施,能够从PDF文档中正确的提取出相应的JavaScript代码,使特征分析更为准确。结合PDF文档的安全性问题的特殊性,设计了单一类别支持向量机的衍生模型,建立了更为完善的机器学习模型,通过子模型的加入,能够对恶意的PDF文档的攻击模式进行分类。与传统的方案相比,这种静态检测方案提高了静态检测的准确度,并能够提供更多的有效信息。在动态检测方面,本文对动态检测PDF文档的安全性的原理进行了介绍并建立了完整的动态检测系统。首先利用shellcode的模拟器libemu对能够提取出shellcode的PDF文档进行直接检测,对其他类型的文档,则通过沙盒机制,利用Cuckoo Sandbox进行详细的行为分析。由于对静态检测结果的充分使用并且加入了模拟器等机制,与单纯的使用沙盒对PDF文档的安全性进行动态检测相比,既能够充分的利用动态检测具有较高的准确率的优点并且能够减少检测时间,提高检测效率。最后本文对整个PDF文档的安全性检测系统进行了介绍和实现,并且利用从网络中收集到的PDF文档的样本对整个系统进行了测试。从实验结果可以看出,整个系统充分的利用了PDF文档安全性问题的特征,能够准确快速的为PDF文档的安全性进行检测和分析。
其他文献
Ad Hoc网络是由一系列具有主机和路由器功能的节点组成的多跳、没有固定基站和控制中心的、可以快速临时自动组网的自治网络系统。它采用分布式管理方法,具有组网迅速、灵活
期刊
移动通信系统的干扰是影响无线网络的质量和传输可靠性的重要因素之一,为了保证移动通信网能够有效地运转,使所有用户能够互不干扰地通信,必须进行干扰的评估与协调,这是无线通信
毫秒脉冲星最显著的特征之一是其自转频率的高精确性和高稳定性,可与原子钟媲美。虽然脉冲星辐射的脉冲功率极强,但地面射电天文站接收到的毫秒脉冲星脉冲到达时间的流密度仅
边缘检测是图像处理、图像分析和计算机视觉领域中最经典的研究内容之一,是图像分析的基础。目前在边缘检测领域已经提出了许多方法,但是至今提出的相关理论和方法尚存在不足
期刊
在基于WLAN的室内定位系统研究和实践中,指纹匹配算法因为其可以纯软件实现且能够有相对较高的精度,被大多数系统所采用,其中指纹采集工作不可避免的产生巨大的工作量和花费
射频识别技术是20世纪90年代开始兴起的一种自动识别技术,该技术以其独特的优势,被广泛应用于工业自动化、商业自动化和交通运输控制管理等领域,而在这些应用中,防冲突机制对
期刊
期刊