【摘 要】
:
软件漏洞预测技术能辅助软件开发和维护保证软件质量。然而,结构复杂且规模庞大的漏洞源码所生成的抽象语法树表示更加复杂,会使基于树的神经网络模型在训练时出现梯度消失或梯度爆炸问题,导致训练效率降低;多向语句树节点数目不同造成编码问题;此外,单一分类器对多类别的漏洞数据预测不够全面。本文就上述问题展开研究。首先,针对漏洞源码的数据表示问题,提出一种DFS-AST语句分割算法。采用动态规划方式将大规模抽象
论文部分内容阅读
软件漏洞预测技术能辅助软件开发和维护保证软件质量。然而,结构复杂且规模庞大的漏洞源码所生成的抽象语法树表示更加复杂,会使基于树的神经网络模型在训练时出现梯度消失或梯度爆炸问题,导致训练效率降低;多向语句树节点数目不同造成编码问题;此外,单一分类器对多类别的漏洞数据预测不够全面。本文就上述问题展开研究。首先,针对漏洞源码的数据表示问题,提出一种DFS-AST语句分割算法。采用动态规划方式将大规模抽象语法树分解为一系列语句子树,通过对嵌套语句进行基于定义规则的分割,保留原始语法树结构的同时减小了数据规模,提高数据质量。其次,针对漏洞源码表征问题,提出一种基于Word2Vec动态处理的漏洞表征算法。通过Word2Vec将语义相似的词映射到空间向量中相邻的位置,利用基于Rv NN的语句编码器和动态批处理算法递归地计算和优化所有节点的向量表示,从而解决编码问题,确保漏洞语义特征充分提取的同时提高训练效率。再次,针对多分类问题,提出一种Multi-output DNN预测模型,同时从特征学习和分类预测两阶段考虑,特征学习阶段全面考虑不同漏洞类别的通用语义特征学习,采用双向门控递归单元(Bi-GRU)捕获漏洞源码的通用结构语义信息;分类预测阶段充分考虑不同类别的漏洞特征差异性,构建漏洞分支层,并可基于迁移学习对Multioutput DNN进行扩展更新,提高模型的可扩展性以及预测性能。最后,本文将Word2Vec动态处理算法与其他方法进行对比实验分析,将Multioutput DNN漏洞预测算法与单一DNN、机器学习算法以及目前较新的软件漏洞预测算法进行对比实验分析,验证其有效性。
其他文献
近年来,多智能体分布式一致性控制在移动机器人、无人机编队、网络化控制等方面有了广泛了发展,已经逐渐成为控制学科中的研讨热点。然而,对于其中最基本的一致性问题还存在着很多内容值得讨论,例如在实际生活中,通信往往通过共享网络执行,这意味着网络通信带宽和智能体的计算资源无法避免地受到限制。本文从这一点出发,通过结合动态事件触发的控制机制,对一般线性多智能体系统展开研究,在保证系统稳定性和一致性的前提下,
三维点云数据任务在计算机视觉以及机器人领域有着广泛的应用,随着深度学习技术在智慧出行、智能家居和智能园区等领域的发展为点云的分类和分割领域提供了新的可能性。然而,由于点云数据本身的不规则性、无序性、稀疏性等固有属性的存在,使得现有的三维点云深度学习架构仍无法避免特征信息提取能力不足、网络框架泛化能力差等问题。本课题以局部采样算法为基础,对三维点云数据的方向编码卷积设计、深度学习分类、分割网络结构设
新冠肺炎是一种传染性很强的疾病。自2019年12月以来,在全球范围内已经造成了两百多万人死亡,给全球人民带来了巨大的伤害。所以及时准确的识别新冠肺炎患者,不仅可以对患者进行及时的治疗,还可以有效防止疫情的扩散。新冠肺炎现阶段主要的检测手段是核酸检测,但是核酸检测的假阴性率太高,而且需要多次检测才能确诊。胸部X光片作为普通肺炎判断的标准,同时也可以成为新冠肺炎诊断的依据。由于新冠肺炎和普通肺炎的医疗
遥操作系统作为能够代替人类在核事故救援、空间探测、远程医疗以及农业等多个领域完成多种复杂操作的远程操作系统,近年来已经得到广泛的发展。随着功能的不断完善,遥操作系统的应用场景更为丰富,这也使得人们对遥操作系统的控制性能有了更高的要求。在实际应用中,遥操作系统主-从系统之间的网络通讯存在不可避免的通讯时延、遥操作系统自身较强的非线性特性以及所处环境的复杂性导致系统的控制性能极易受到通讯时延、模型参数
随着科学技术的高速发展和人类社会的不断进步,海洋逐渐成为各个国家争相研究的对象。我国是海洋大国,未来也必将会是海洋强国,党和政府都高度重视对海洋的研究和开发。水下无线传感器网络是近年来对海洋进行数据采集和监测的重要工具,具有很高的研究意义和研究价值。网络中有许多值得研究的方向,本文主要就水声信道质量预测、动态节点移动策略和静态节点中继部署三个方面进行了深入研究,主要研究内容为:(1)水下无线传感器
水泥工业是我国国民经济发展的支柱产业,水泥烧成系统是水泥生产的三大环节之一,对水泥烧成系统生产过程进行优化,对降低生产过程成本,提高水泥产品质量具有重要意义。目前,水泥烧成系统生产过程的优化主要依赖于操作员的经验,无法保证优化操作的合理性,同时在生产过程会由于操作的不合理性造成大量的能源消耗。本课题结合水泥烧成系统生产过程优化问题,对卷积神经网络(Convolution Neural Networ
睡眠是人类基本的活动,高质量的睡眠状态有利于人体的身体健康。随着生活和工作压力的加大,睡眠相关的疾病在当今社会日益突出,威胁着人们的身体健康和日常生活。目前通过人工标记睡眠分期需要人力和时间成本,效率低且主观性强。该文针对目前睡眠分期的类别不平衡、长时间依赖关系等问题出发,利用深度学习实现自动睡眠分期,在公开的数据集睡眠记录(Sleep-European Data Format,Sleep-EDF
随着不可再生能源消耗量的逐年增加,以及环境污染问题的日益加重,各个国家开始将目光转向低碳化的能源。由此,基于分布式能源的微电网应运而生,但微电网系统的控制策略及在不同工作模式间的切换稳定性仍存在很多待解决的问题。因此,本文针对相关问题进行研究,以改善微电网系统控制策略的有效性,提高运行稳定性。首先,对微电网的控制结构、运行模式、控制策略与常用分布式电源的数学模型进行了分析介绍,为后文微电网模型的建
随着医学信息化建设的快速发展,电子病历已成为医院诊疗的重要依据,如何对有价值的医学信息进行精确识别已成为研究热点。在进行实体识别时,传统识别方法特征利用相对简单,没有充分挖掘实体相关特征,同时也无法学习到深度双向的全文语义信息。因此该文针对以上问题采用深度学习识别算法,进行了以下研究。首先,针对实体内部结构信息未被充分挖掘,造成形态层次特征丢失的情况,构建融合字及笔画特征的双向长短期记忆网络(Lo
近年来,角度传感器在大型工程结构状态检测中广泛应用,而传统的电类和磁类角度传感器存在抗电磁干扰性差、灵敏度较低等缺点,很难实现对角度矢量的准确测量。光纤角度传感器具有较高的灵敏度、较强的复用性以及可用于分布式测量等优点,因此,本文提出研究用于矢量角度测量的光纤传感器。本文在分析总结角度传感器的种类及研究现状的基础上,通过比较不同角度传感器的优缺点,提出基于光纤光栅阵列的角度矢量传感器,并利用其进行