大规模源代码脆弱性检测算法改进研究及系统实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:niuniu04
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
源代码的可靠性是软件系统安全的重点,传统的源代码脆弱性分析技术面临着规则制定困难、检测漏报误报率高的问题,随着大数据对安全的赋能,基于深度学习算法的大规模源代码脆弱性检测方案,能有效提升源代码分析规则生成与匹配的精准度,然而其检测粒度较粗,主要适用于对源代码进行文件或函数级别的分析,难以对复杂结构代码进行语句级别的细粒度分析。最近基于图神经网络的大规模源代码脆弱性检测研究,主要关注复杂结构源代码的行级细粒度脆弱性准确识别发现,但仍存在着在大规模源代码分析场景中检测效率低、现实可行性差的不足。为此,本文研究了源代码相似度脆弱性检测和稀疏矩阵存储格式动态选择方法,并引入到了源代码规模优化和脆弱性检测效率改进方案中,具体介绍如下:针对基于图神经网络的大规模源代码脆弱性分析过程中,代码规模激增导致的检测功效降低的问题,本文提出了面向源代码语法和文本的双重规模优化框架,研究了基于程序依赖图的源代码形式化表征方法和基于igraph的图表征匹配方法,利用相似性检测技术和程序依赖图剪枝,设计了大规模源代码的语法去重、克隆识别等规模优化算法。理论分析与实验结果表明,在国家漏洞数据库和部分软件保障参考数据集中,本文方案能够显著缩减源代码、有效检测克隆代码,提高脆弱代码检测准确率。针对基于图神经网络的大规模源代码脆弱性分析过程中,模型检测效率的瓶颈问题,本文提出了基于源代码生成的向量矩阵与稀疏矩阵存储格式自适应匹配模型,构建了向量矩阵仿真数据集和稀疏矩阵最优存储格式数据集,设计了基于XGBoost模型的源代码向量化后稀疏矩阵存储格式动态选择算法。理论分析与实验结果表明,相比同类研究,本文方案能够有效提高现实场景中基于图神经网络的源代码脆弱性检测的训练和检测效率。上述源代码规模优化方法和脆弱性稀疏矩阵存储格式动态选择方法,提高了基于图神经网络的大规模复杂结构源代码脆弱性细粒度检测技术的实用性。利用上述改进方法,本文研发了一个基于图神经网络的源代码脆弱性细粒度检测原型系统,实现了从项目源代码获取到源代码脆弱性展示的全部7个过程;通过将其整合到自研的私有云平台,支撑了电子政务、智慧城市等应用场景中的安全脆弱性分析,进一步验证了方案的现实可用性和有效性。
其他文献
近年来网络信息技术蓬勃发展,在各个领域都形成了海量的数据,而机器学习作为一种智能信息处理技术为人们挖掘数据中有用的信息和知识提供了高效的技术手段。现实世界中的数据往往呈现出不平衡分布的特点,这种现象广泛存在于医疗诊断、工业、金融等领域。因此,研究不平衡数据分类问题具有重要的现实意义。本文从算法层面提出了两种解决思路并进行了算法实现,主要工作有:第一,本文提出了一种基于形心自监督损失的不平衡数据分类
学位
膜荚黄芪(Astragalus membranaceus(Fisch.)Bunge)是常用的中草药之一,毛蕊异黄酮葡萄糖苷是其主要的生物活性成分,具有多种药理作用,是评价黄芪质量的标记化合物之一。随着黄芪野生资源的枯竭,植物不定根培养成为获取其有效成分的可行途径之一,但膜荚黄芪不定根中毛蕊异黄酮葡萄糖苷含量较低,且尚不了解其积累机制。有研究表明,干旱胁迫可增加植物中次生代谢产物的含量,本研究以膜荚
学位
甘露醇(Mannitol)是一种功能性甜味剂,在食品、医药和化工领域得到了广泛的应用。随着人们对甘露醇认识的加深以及对健康饮食的追求,未来全球对甘露醇的需求量将不断增长。利用微生物发酵法生产甘露醇,条件温和,没有副产物山梨醇生成的同时,还能为食品带来附加营养价值,促进人体健康,具有广阔的前景。柠檬明串珠菌95-9是一株诱变菌株,已被证实具有很强的产甘露醇能力。在实际生产中,菌种随着保藏时间的延长或
学位
紫红参为人参的干燥根和根茎的深加工产物之一。紫红参产品外观呈现淡黑褐色或者黑茶褐色,所以紫红参又被称为黑红参或黑参(文中紫红参又记作“黑参”)。最近几年对紫红参的炮制方式、化学成分、药理作用和毒理研究等研究比较深入。紫红参与人参相比较,它的炮制工艺中包括了蒸制、晾晒等,这些工艺需要较长的时间,而在这一过程中许多人参固有的人参皂苷就会转化形成稀有人参皂苷,所以人参固有的治疗功能也会发生变化,由于加工
学位
随着集成电路工艺的不断进步,芯片的特征尺寸也进一步减少,10nm以下特征尺寸的集成电路芯片时代已经到来,然而最适合10nm节点芯片制造的极紫外光刻(Extreme Ultra-violet,简称EUV)技术并不成熟,且价格昂贵,因此需要一种可以代替的技术来实现先进工艺节点下芯片的制造。利用已经成熟的浸没式光刻技术,结合三重光刻工艺便可以实现这一目的。三重光刻工艺是先将原始版图上的版图图形分配到三个
学位
随着电子设备的日益更新换代以及制造工艺技术的不断进步,温度传感器在越来越复杂化的应用系统中的重要性越来越明显,保证系统工作在适当的温度中对于系统的可靠性至关重要。电子信息、工业控制以及医疗设备等领域中对高精度温度传感器的需求越来越大,在精度严格的系统中如果温度检测失误偏大,往往会造成不可修复的后果,产生极大的损失,而传统的温度传感器的精度与实时性等性能较差,在工业生产应用中所受局限性很大。相较于传
学位
糖组学是对糖链组成及其功能研究的一门学科,主要研究糖与糖、糖与蛋白质之间的联系和相互作用。质谱技术具有较高的灵敏度和选择性,是进行糖组学分析的主流工具之一。随着质谱技术的发展,质谱仪结合适当的样本制备技术能够在短时间内产生海量的糖链质谱数据,同时研究人员也设计出许多糖链质谱分析方法,试图鉴定出质谱数据对应的糖链结构。鉴定出的糖链结构的正确性非常重要,若鉴定结果没有正确性保证,就会误导研究人员后续对
学位
肥胖已成为引起全球性关注的慢性疾病,是影响人体健康的主要因素,当前减肥产品多伴有副作用,开发安全有效的天然植物产物用于预防肥胖具有重要意义。本试验以富含黄酮类化合物的洋葱皮水提物为研究对象,通过体外细胞试验和体内小鼠试验研究洋葱皮提取物(Onion peel extract,OPE)抗肥胖作用,通过考察生脂基因表达变化初步研究OPE分子作用机制,主要研究内容和结果如下:(1)以3T3-L1前脂肪细
学位
现场可编程门阵列(FPGA)具有集成度高、逻辑资源丰富、设计灵活、开发成本低等优点,在国防和民用电子系统设计中得到广泛的应用,并将在未来5G技术的发展中占据核心地位。然而支持FPGA的EDA软件目前由国外企业垄断,是严重阻碍我国芯片发展的一个瓶颈。因此,随着国产FPGA芯片的不断推出,充分利用现有的科研成果,研究和开发与之相配套的拥有自主知识产权的支持FPGA的EDA软件迫在眉睫。在此背景下,本文
学位
近年来,随着三维数据采集设备的不断发展,计算机开始以一种新的方式认知与理解世界。由于点云采集设备在对同一物体进行采集时会因为视角、遮挡等问题无法仅通过一次扫描便获得完整的物体信息,需要对物体进行不同视角的扫描,而视角变换会导致同一物体不同部分的数据处于不同的空间坐标系中,因此需要点云配准技术将不同坐标系中的点云映射至同一坐标系中从而实现点云数据之间的对齐。随着深度学习在二维视觉领域所取得的巨大成功
学位