基于源代码张量特征的漏洞检测方法研究

来源 :范元海 | 被引量 : 0次 | 上传用户:nihaosww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
21世纪以来,代码安全性分析研究成为网络安全的关键基础技术,针对源码的漏洞检测技术取得了长足发展。代码特征发展出基于统计特征、tokens序列、抽象语法树、代码语义图的技术路线;检测算法发展出基于相似性判定、漏洞规则和人工智能的技术路线。基于深度学习的漏洞检测方案极大的解放了安全专家工作量,具有更好的泛化能力,但现有检测模型高度依赖数据集,对复杂漏洞检测精确度不高,严重制约漏洞检测技术的实际应用。为了改进多维代码语义的嵌入,提高漏洞检测效能,对张量结构代码特征及检测模型进行研究。构建了张量结构的代码特征,提取抽象语法树、控制流图、数据依赖图和自然代码序列四种代码图构建张量特征,利用张量在语义完整性和局部关联性的优势实现多维语义融合。整理归类了函数样本,得到一个包含13种漏洞共158259个函数样本的数据集用于实验评估。改进了多维语义嵌入模型,将Tensor GCN应用于漏洞检测,将基于张量循环矩阵的Circ GGNN应用于多维语义融合,设计了基于一维卷积的输出层,提升了漏洞检测效果。通过7个数据集上的实验对比,基于Tensor GCN的检测模型相比Devign准确度提高24.95%,精确度提高26.87%,召回率提高7.75%,F1-score提高21.67%;基于Circ GGNN的模型相比Tensor GCN准确度提高5.01%,精确度提高14.28%,召回率提高6.4%,F1-score提高11.93%;基于多特征筛选的Circ GGNN+Tensor GCN方案相比Circ GGNN准确度提升2.13%,精确度提升4.6%,召回率提升3.94%;F1-score提升4.44%,证明在多维语义嵌入方面Circ GGNN优于Tensor GCN,而Tensor GCN优于Devign,并且基于多特征筛选的Circ GGNN+Tensor GCN检测模型能够有效提升漏洞检测效能。
其他文献
中国形象是卢梭建构个人政治思想体系必不可少的对照系统。卢梭的中国观包括:较为先进的管理制度、虚有其表的专制帝国以及自我束缚和自我奴役的人民三个方面。这一中国观的形成主要受到卫匡国《鞑靼战纪》、“中国热”理性化、安森《环球航行记》以及李明《中国近事报道》的影响。通过分析卢梭中国观作为虚构的形象的生成过程,可以发现卢梭中国观对于卢梭个人来说是合理的、现实的,是在“中国热”的背景下最有说服力的例子。关于
学位
纵观全球高等教育事业发展的历程,高等教育质量长期以来被看做提高综合国力和增强国际竞争力的关键因素,受到政府和社会各界的关注。教学质量是衡量高等教育质量的关键维度,所以,全球很多国家和地区都把寻求优秀的教学视为高等教育优先发展的目标。面对高等教育教学质量问题的日益凸显,英国政府积极推进高等教育体系和高校教学质量保障体系建设的改革,教学卓越与学生成果框架(Teaching Excellence and
学位
随着智能监控和虚拟现实等依赖于视频实时处理技术的智能应用服务的出现,以及深度学习在计算机视觉领域的飞速发展,智能视频服务极大地丰富了人们的日常生活。然而受限于移动终端的硬件配置,用户设备往往无法部署和运行用于视频处理的视频服务模型。通过边缘计算技术将视频服务模型部署在靠近用户设备的边缘云上,直接处理用户设备的视频流请求,可以有效降低网络延迟并解决用户设备计算资源不足的问题。由于边缘云的计算资源和带
学位
认识治理作为对特定行动者如何通过作用于人们对世界的思考和行为方式来实现社会变化这一过程的分析框架,在全球化背景下成为一种研究社会变化并为其辩护的方法论工具。进入21世纪,各种与人类命运密切相关的全球性公共危机加剧了社会的复杂变化,现代性困境在当前社会情境下有了新的表现形式。未来的不确定性与各种价值观念之间的冲突使得不同文明走向对话的必要性和必然性大大增加,文明对话也将是构建人类命运共同体的基本路径
学位
内容分发网络(Content Delivery Network,CDN)通过靠近用户的边缘缓存节点向用户提供内容,截至2021年互联网中77%的流量经CDN进行加速。在CDN的边缘缓存节点上往往多个流量类共享同一个缓存池,且不同流量类的负载模式存在高度复杂性和强动态性,如何对各流量类的缓存空间进行按需动态分配,对CDN的服务质量影响很大。然而目前常见的使用“白盒”思想进行缓存空间分配的基于缺失率曲
学位
大数据、区块链等新兴数字智能技术的发展,使工业生产逐渐走向数字化和智能化。当前,中国企业特别是中小微企业在数字化和智能化转型中最突出的问题是缺少高素质人才队伍的支撑,尤其是复合型、创新型数字化人才。高校作为人才培养基地,为工业生产活动提供高素质的数字化人才成为重要任务。因此,加强工科生数字化能力的培养成为高校的重要目标之一。何为数字化能力?工科生的数字化能力有哪些具体要求?在加强工科生数字化能力培
学位
恶意PDF(Portable Document Format)文档是恶意代码的常见形态,具有传播范围大、利用方式隐蔽、用户难以防范等诸多特点,已经成为网络安全的重要威胁。目前针对恶意PDF文档的检测方法都有一定的不足:1)静态检测方法难以应对混淆加密后的样本,动态检测针对的是单一恶意行为;2)基于机器学习的检测方法主要二分类识别恶意PDF,缺少对恶意行为的深入分析。针对上述问题,首先分析了恶意PD
学位
为了提高数据中心资源利用率以及降低成本,不同类型的应用往往会被混合部署在同一台服务器上。然而,由于吞吐型应用会对延迟敏感型应用造成极大的I/O干扰,为延迟敏感型应用提供低延迟的I/O服务从而快速响应客户端的请求至关重要。相较于传统的固态硬盘,超低延迟固态硬盘(如英特尔傲腾固态硬盘)可以提供极低的访问延迟。然而,如果简单地将此类硬盘应用在数据中心中,严重的I/O干扰将使得延迟敏感型应用不能充分利用超
学位
区块链技术具有去中心化、不可篡改、可溯源的特点,将区块链与慈善系统结合可以解决传统慈善系统缺乏公信力、数据造假以及善款难溯源的问题。但慈善组织之间存在信任问题,区块链长时间的运行也会导致慈善数据规模过大,给节点带来存储压力,这些问题需要从区块链的共识和存储两方面进行改进。针对区块链Raft共识机制的优化,提出了基于节点优先级的Leader选举机制,添加校验者节点并将日志提交方式从单步提交变为批量提
学位
“特”在现代汉语中使用频率较高,从古至今,其义项发生了很大的改变。在《现代汉语词典》(第七版)中,“特”有七个义项,这实则是历时语法化链在共时层面上的反映,“特”的语义存在历时演变的过程,其各义项之间存在内在发展联系。当前,词典中对“特”的解释既没有横向的义项派生联系,也缺乏纵向的词义动态变化线索。从语法化角度切入“特”的历时演变,将共时与历时角度相结合,可以较为有效的说明“特”各个义项之间语义发
学位