基于相似度匹配的二进制软件漏洞检测技术研究

来源 :北京邮电大学 | 被引量 : 0次 | 上传用户:kaji2009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
软件在社会经济和日常生活中起到越来越重要的作用,而其安全现状却不容乐观,因此,软件漏洞检测技术成为了当前安全研究的热点。二进制代码分析是二进制软件漏洞检测的一种常用方法,目前基于二进制代码的静态分析方法已经被广泛应用于漏洞检测,通过构造代码的抽象语法树或计算代码执行路径的编辑距离来进行代码相似性分析。此外,基于机器学习的二进制漏洞搜索工作也取得了很大的进展,通过提取二进制代码的典型特征、构造程序控制流图,并建立机器学习模型来进行代码相似度比较,从而判断二进制软件是否存在已知漏洞。然而这些方法的计算成本巨大,而且未能充分利用二进制代码中的各级别特征以及指令中的语义信息。为此,本文提出了一种新的基于深度学习和图匹配的二进制软件漏洞检测方法FIT,结合深度学习和图匹配的优势,有效地检测软件漏洞。具体来说,本方法首先通过词嵌入技术将每条指令映射为一个定长的实值向量,然后根据3层特征控制流图构造基于长短期记忆模型(LSTM)和深度神经网络的函数预筛选模型,筛选出存在潜在漏洞的可疑二进制函数,最后采用改进的图匹配技术对可疑函数和已知漏洞函数的相似性进行更精准的比较。本方法不仅充分利用了二进制代码的各层特征,而且长短期记忆模型能自动学习指令序列的语义信息,提高了二进制软件漏洞检测的准确性和性能。本文在常用软件OpenSSL、CoreUtils和其他真实软件数据集中进行的一系列实验表明,相比于现有的基于深度学习的二进制漏洞检测方法以及结合机器学习和图匹配的混合方法(Gemini、CVSSA和discovRE),本文提出的方法在性能和准确性上都有提高。具体来说,对于训练模型的准确性,FIT的AUC为0.961,而Gemini、CVSSA和discovRE在相同测试集上的AUC分别为0.889,0.787和0.659;对于图匹配的准确性,FIT比其他方法能找到数量更多的正确匹配函数对;对于真实二进制软件,FIT能够成功检测已知漏洞。此外,对本文词嵌入模型的评估表明,利用词嵌入模型训练得到的指令嵌入能够有效地表示指令的语义信息,有助于提升FIT的漏洞检测能力。
其他文献
随着卫星导航定位产业的蓬勃发展,各相关行业对卫星定位精度的要求越来越高,基于载波相位差分的高精度定位技术逐渐成为研究的热点。载波相位差分定位中最重要的步骤就是获得
随着计算机网络的发展和普及,在网络上流通的数据正变得越来越繁杂、结构种类越来越多,人们的生产生活也更加依靠网络的正常运行;但同时,网络攻击的发生频率也越来越频繁,形式越来越高级、隐蔽,因此,在日益复杂的网络安全形式下,如何确保网络的安全运行,对事故和攻击做到防范以及识别,成为了各行业重点研究对象。本文以网络安全等相关数据为中心进行可视化,通过多种可视化方法以达到高效提炼、展现、分析网络安全态势信息
城市要进步和发展必然离不开兴建邻避设施,但邻避设施由于其天然存在的“缺陷”,在兴建过程中往往遭至周边居民的不满。近年来,我国城市化进程“如火如荼”地推进,围绕着邻避
能量代谢在肌肉向食用肉转化过程中具有至关重要的作用,与肉品的嫩度、颜色、持水力等品质密切相关。宰后猪肉成熟期间产生大量的活性氧类及氮类物质,其中由一氧化氮合成酶(N
惩罚性赔偿是一种不同于补偿性赔偿的民事赔偿制度,具有惩罚和威慑侵权行为的作用。相对于民法中的“填平原则”,该制度所设定的赔偿数额要超出实际损失的数额,一方面充分地补偿了权利人的损失,另一方面也因其较高的震慑力而减少侵权行为的再次发生。2018年12月审议了最新《专利法修正案(草案)》。本次专利法修改的主要内容就包括强化专利保护,提高侵权违法成本,加大赔偿力度,新增对严重故意侵权行为的惩罚性赔偿,并
目的:本课题研究骨碎补总黄酮对大鼠胫骨牵张成骨模型骨结构、Wnt3a和β-catenin蛋白表达的影响,探究骨碎补总黄酮对大鼠牵张成骨模型有效药物浓度,为骨碎补总黄酮在促进牵张成骨中骨形成及修复,加快成骨速度,提高成骨质量提供理论依据。方法:将60只雄性SD大鼠左侧胫骨截骨并短缩4mm,以环状外固定器固定,造模成功后,适应性饲养1周后将其按体重分层应用随机数字表法对其进行分组,分别为高剂量组、中剂
自上世纪80年代计划生育政策全面实施以来,取得了显著效果,一是有效控制了人口的过快增长,政策实施后我国少出生了3亿多人,为经济长期快速发展提供了有利的人力资源支撑,二是有效缓解了人口对资源环境压力,改善了人民群众的生存和发展状况。我国在有效控制人口过快增长,社会经济发展取得举世瞩目成绩的同时,家庭结构普遍性的变成了只有一个孩子的核心家庭。当不少成年的独生子女遭遇各种风险事件离开人世,便留下了一批数
美国作家Max Stohn所著的How to Understand Data and the Digital Transformation属于科普文本,译者节选其中的前六章进行翻译与分析。该作品主要介绍在当今大数据时代,各企业集团运用数字支持系统为经济发展带来了极大的便利。结合原文写作特点和语言表达,译者采用Verschueren提出的顺应论指导本次翻译实践,并对源语材料中的名词性结构进行分析研究
上海作为我国人口老龄化程度较高的城市,面临着较为严峻的养老服务市场供需问题。伴随着多元化、多层次的养老服务需求,服务多元主体间的矛盾逐渐凸显,在一定程度上导致供给投入与需求获得不匹配,养老服务行业的持续发展面临挑战。“是否给人民群众带来获得感”是评价改革成效的标准之一,因此,应从老年居民的服务需求出发,从老年居民服务获得感本位出发,将老年居民的“获得感”作为衡量养老服务行业发展的重要指标,这对于促
风电近几年发展十分迅速,不仅受到世界各国的高度重视,也是我国增长最快的新能源。由于恶劣的工作环境,风力涡轮机极容易发生故障,而行星齿轮箱是其中故障频率最高的部件,且因其特殊的物理结构,一般的故障诊断方法难以在实际工程中应用,其故障诊断成为亟需解决的技术难题。本文依托实验室风力涡轮动力传动诊断模拟器,设计了行星齿轮箱的故障诊断实验,采集故障数据,分析其振动信号的动态特性,并对振动信号进行故障特征提取