基于图神经网络的漏洞检测技术研究

来源 :西安工业大学 | 被引量 : 0次 | 上传用户:su9989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生产力水平的发展,人们对于软件功能的需求不断增加,导致软件的体系结构也随之变得复杂,无形之中提高了软件中可能存在安全缺陷的概率。此外,代码复用也会给漏洞的传播提供可乘之机。一旦这些安全漏洞被不法分子所利用,所造成的损失不可估量。因此,如何保证软件安全成为人们亟待解决的问题。随着深度学习技术在图像领域以及自然语言处理领域获得了巨大的成功,大量的信息安全研究人员也开始使用深度学习的方法来进行漏洞检测。然而,目前基于深度学习的漏洞检测方法大多使用单个图来进行源代码表征,并没有完整的保留源代码中所有的语法、语义、控制流等信息,导致在代码表征过程中出现信息丢失的现象。此外在进行特征学习时单纯的将漏洞特征输入到深度学习模型当中,并没有考虑到其中与漏洞关联度较低的特征,将会对模型的性能产生影响。针对上述问题,本文提出了基于图神经网络的漏洞智能检测方法,具体的研究内容如下:(1)由于目前信息安全领域内缺乏大规模、有效的源代码数据集,本研究利用爬虫程序从NVD、Github等网站收集数据样本。首先从漏洞公开披露网站获取含有漏洞的源代码文件;其次利用人工的方式来对含有错误信息的样本数据进行修改,从而得到一个含有49736个样本的漏洞数据库;最后通过代码切片、抽象语法树提取、控制流图提取等操作分别得到源代码对应的抽象语法树以及控制流图,将其作为后续模型训练与测试的样本数据。(2)针对漏洞检测模型,使用了基于注意力机制的消息传递网络模型来进行漏洞检测。首先将源代码视为文本序列,通过token-focused方法来进行代码图特征的构建,并使用PL(Programming Language)模型中的预训练模块来进行节点的初始化。在特征学习过程中,通过使用通道空间注意力机制将输入的特征分别进行平均池化和最大池化操作,对于漏洞相关的特征赋予更高的权重,提升模型对于漏洞相关节点信息的敏感度,从而使得模型性能得到有效提升。实验结果表明,该模型的漏洞检测精度优于其他基于的自然语言处理的深度学习模型。(3)针对目前代码表征过程中出现的信息缺失、信息不丰富问题,本文提出了源代码表征方法Multi-Graph Fusion,使用抽象语法树以及控制流图来进行代码表征。并且使用了MGFN(Multi-Graph Fusion Network)模型,分别对两个特征向量进行提取。在特征融合方面,考虑到抽象语法树和控制流图对于漏洞检测结果的不同影响,为了更好的融合两种尺度的特征,本文使用了基于注意力机制的注意力特征融合(Attentional Feature Fusion,AFF)。该方法分别将两个向量输入到MS-CAM模块中,通过两个通道来进行局部和全局的特征融合,利用sigmod激活函数获得不同特征的权值,并利用该权重对于输入的两个向量进行加权平均,从而得到最终的融合特征。综合以上内容,本文利用所提出的基于图神经网络的漏洞检测模型在所构建的数据集上进行对比实验。实验结果表明,与现有的模型相比,该模型在此数据集上的精确率提高了13%;召回率至少提高了11%;F1分数则提高了10%。
其他文献
突发性灾害过后,救灾物资储备中心先派出大型车,向物资分发点运送应急物资,各个分发点再派出小型车将物资配送至物资需求点,考虑应急物资不足且不同需求点对同种物资的需求重要度不同的情形,定义同一种物资对每个需求点的单位需求重要度,分别以总需求重要度∑(每个需求点对同一种物资的单位需求重要度*需求点的物资实际配送量)最大和总运输成本最小为双目标,以单个需求点全部需求被满足产生的最大需求重要度与实际配送到的
学位
随着电子商务市场的快速发展,基于邻里社交的社区团购模式应运而生。该模式主要依赖于平台和靠近消费者端的团长之间的有效协作,共同构建了以平台为核心的供应链模型。具体而言,平台负责产品的选品和物流配送,而团长则负责终端促销和顾客关系维护(本文统称为努力投入水平)。实践证明,团长的努力程度直接影响到供应链的运作效率以及双方的利润。因此,平台需要探索科学有效的激励机制,以推动团长做出有利于双方收益最大化的决
学位
随着电商的迅速发展和客户需求的不断变化,对仓配中心的货物拣选效率提出了更高的要求。货位指派和订单分批作为影响拣选效率的关键因素,成为企业急需解决的重要问题。本文基于货到人拣选模式,研究订单随机到达的货位指派与订单分批问题,首先,在考虑了随时间动态变化的商品需求频率和关联性的前提下构建动态货位指派和订单分批模型;其次,针对现有拣选策略的不足设计新的拣选策略和求解算法;最后,进行仿真实验对比不同拣选策
学位
随着虚拟现实技术的快速发展,虚拟手术作为虚拟现实技术在医学领域的典型应用,已从传统的视觉交互向触觉交互发展,因此力反馈模型的研究成为虚拟手术的关键技术,一个良好的力反馈模型和力反馈算法可以为虚拟手术带来更强的沉浸感。本文以虚拟现实技术在口腔医疗教育培训中的应用作为背景展开,研究了力反馈的两个阶段,即几何建模阶段和力反馈建模阶段,在现有力反馈模型基础上提出了改进方案,解决了反馈力输出不连续且不稳定的
学位
为保障生态文明建设,实现可持续发展,中国在2020年提出了双碳战略目标。作为近年来快速发展的综合性服务业,物流业的碳排放量一直在我国占据较大比重,为响应国家的双碳目标,急需由高碳排放发展模式向低碳发展模式转型,而环境规制是实现低碳物流转型的重要手段。目前关于环境规制的研究主要从单一环境规制工具的角度出发,较少考虑不同环境规制工具的交互作用;同时现有研究还发现环境规制对我国碳排放效率存在非线性的门槛
学位
视线估计技术是利用现有的不同检测方法获取用户当前注视方向的技术。视线估计在生活中发挥着越来越重要的作用。在注视的过程中,伴随着头部的运动行为,如何提高头部运动变化时中的视线估计精确度,是目前视线估计领域的一个挑战。本文提出使用眼动特征并结合头部运动变化特征的视线估计模型。论文主要研究了如下内容:1)眼动特征提取本文眼动特征主要包括瞳孔中心、眼角点以及二者构成的眼动向量。首先应用Haar特征和Ada
学位
当前光学遥感图像目标检测技术在军事、环境、城市规划、农业、林业等领域有着广泛的应用。与自然图像相比,遥感图像具有小目标多且密集分布、方向多样、背景复杂和目标尺度变化范围广泛等特点,这为通用目标检测算法在遥感图像上的应用带来了一定的挑战。对此也有很多针对性的改进算法被提出来,但是大多都只从遥感图像中的某一两个难点问题出发,而缺乏一定的综合性,其检测性能也很难达到在普通图像上的较高水平。为了能够更加快
学位
随着大数据信息化时代的到来,各个领域数据信息急剧增长,人们对数据信息处理技术的要求也越来越高。压缩感知突破奈奎斯特采样定律,很大程度上缓解了数据的获取和传输压力。传统的压缩感知重构算法需要进行多次迭代求解原始信号,使得算法计算速度慢,重构精度差,且不具有实时性等优势。近年来,随着深度学习的快速发展,深度神经网络技术在压缩感知领域的应用有效地提高了压缩感知重构的精度和效率,并引起学者们的广泛关注和研
学位
如今的互联网时代,大量的新闻出现在人们的日常生活中,需要人们花费更多精力和足够时间在庞大的信息库中去搜索和甄别我们感兴趣的内容,而文本自动摘要技术可以在不更改文章含义和不丢失其重要信息的前提下,概括出新闻的关键信息和主体内容,从而帮助人们减少阅读的时间。近年来指针生成网络模型(Point Generator Network,PGNet)的提出极大地促进了摘要生成技术的发展,有效解决了未登陆词无法生
学位
随着软件规模的不断增加和复杂性的提高,软件中存在的安全隐患也越来越多,这使得软件容易受到不法分子的攻击。为了有效提高软件的安全性,漏洞检测技术成为了软件安全领域的研究重点。由于图模型具有较强的表征能力,基于图模型的漏洞检测研究应运而生。然而,现存的图模型在源代码的表征过程中,存在图模型较为单一而导致的源代码表征信息缺失,使漏洞检测的误报率增加的问题。同时由于源代码结构复杂,导致对应图结构信息冗杂,
学位