基于机器学习的二进制软件漏洞挖掘技术研究

来源 :北京邮电大学 | 被引量 : 5次 | 上传用户:masonchina
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着代码量和代码复杂度的不断提高,存在越来越多容易被攻击者所利用而导致原始程序逻辑错误的漏洞。为了能尽早发现并修补软件中存在的漏洞,二进制软件漏洞挖掘技术成为了安全研究领域的热点课题之一。使用机器学习的二进制漏洞检测模型有着能批量处理大规模数据,检测速度快,检测成本低的优势。但是因为二进制级别的软件不能直接表达程序信息,无法从中提取有效的特征集,导致现有的基于机器学习的二进制漏洞挖掘方法往往具有较高的漏报率和误报率。在此情形下,本文结合机器学习和自然语言处理技术,提出一种二进制特征提取的方法并在Android平台上设计和实现了一个漏洞检测系统。本文的主要工作及成果如下:1、通过对二进制文件预处理和词嵌入技术的研究,提出一种基于底层语言的特征向量化模型,使用这种模型可以从二进制文件中初步构建出包含汇编指令内上下文关系的特征向量。2、通过对深度神经网络的研究,提出Att-BLSTM特征提取模型,该模型的核心是双向长短期记忆网络(BLSTM)及注意力(Attention)机制,通过这种模型可以从二进制文件中提取出包含丰富程序语义信息的二进制特征向量。3、经过研究,本文并未在网上和其他论文中找到可用的Android平台二进制软件的漏洞数据集。为了完成本文的实验工作,本文通过从漏洞信息发布平台收集到了从2000年到2018的漏洞信息,并建立了一个Android平台二进制软件(动态链接库文件)的数据集。4、基于所提的两个模型,本文在Android平台上设计并实现了一套二进制漏洞检测系统。测试结果表明,相较于现有的基于机器学习的二进制漏洞挖掘方法,本文所提出的模型能够更好地学习二进制文件的程序语义信息,基于该模型所设计的漏洞检测系统的精确度最高能够达到93.86%。
其他文献
目的了解2014—2017年盐城市盐都区食品、公共场所从业人员甲型肝炎(甲肝)和戊型肝炎(戊肝)感染状况,为有针对性地做好急性肠道传染病预防控制工作提供依据。方法对2014—201
民国时期是中国考古学从传统转向现代的一个特殊时期,有着金石学根底的本土学者与有着留学背景的新型考古学者之间,既有一定的学术承续,又有明显不同的学术取向,构成中国考古
本文通过对栾川地区的休闲农业发展情况进行研究,说明了发展休闲农业对于县域经济发展的作用。着重分析了其发展的现状特点及动力因素,指出发展方式的特别之处并给出了相应的
清代上书房是诸皇子接受教育的场所。为培养诸皇子成为未来的统治者,清代诸皇帝对何人可以担任上书房师傅颇为重视,不仅选拔德才兼备的人担任,而且在官品的限定上也有一定的
<正>"可惜不是你,陪我到最后,曾一起走却走失那路口;感谢那是你,牵过我的手,还能感受那温柔。"随着江苏卫视相亲节目《非诚勿扰》的火爆,节目中男生败退时的这首背景音乐也跟
白鸟库吉东洋史学研究的学术背景源于西方,研究方法受德国史学家路得维格.里斯影响,注重考据与实证,而纵观其整个学术历程,"满鲜历史地理调查部"的相关工作构建了其东洋史学
目的考察护士心理资本、组织承诺和工作倦怠三者的关系,分析护士心理资本是如何影响工作倦怠的,从而为医院管理者及护士自身健康发展提供理论指导及有效的应对措施,并进一步
胃食管反流病是一种慢性难治性疾病,本文从胃食管反流病的历史沿革、病名规范、发病基础、病机关键、辨证分型论治等方面系统总结了甘肃省名中医田旭东治疗胃食管反流病的经
针对典型人物报道如何呈现、引导价值观,以及如何更好地实现典型报道的价值导向功能等问题,本研究对《人民日报》"身边的感动"专栏典型人物报道开栏以来两年间的报道进行了批
目的 分析奥卡西平(OXC)治疗成人癫痫发作时10-羟基卡马西平(MHD)血药浓度、用药剂量、疗效及不良反应间的关系。方法 选取92例成人癫痫患者,均给予OXC治疗,根据治疗情况逐渐