基于NLP神经网络的软件漏洞自动分类方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:chnool
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年来,伴随着各个领域信息化程度的提高,漏洞的种类和数量也在逐渐增多,这些漏洞一旦被黑客攻击利用,信息系统的安全性就会有很大的风险。与此同时,信息安全已经上升为国家战略,那么如何对已经存在的漏洞进行有效地分类管理,提高漏洞修复和管理的效率,则变得尤为重要。本文以漏洞文本日志为依据,以自然语言处理技术和神经网络技术为支撑,从漏洞文本特征表示和漏洞分类模型构建两个方面入手,对已知漏洞的分类技术进行了研究,介绍了软件漏洞文本的表示方法和漏洞分类方法,论文的主要内容如下。首先,分别介绍了NLP神经网络技术和软件漏洞分类技术的国内外研究现状,总结了漏洞分类中常用的文本表示方法和分类方法。针对传统的文本特征提取方法生成的文本向量空间呈现出的高维性和稀疏性而导致漏洞分类准确性不高的问题,本文基于TF-IDF和信息增益理论和采用Word2Vec的Skip-gram语言模型方法,提出了词的加权分布式表示方法,即TFI-W2V算法,使用该算法将每条漏洞文本中的词映射到有限维度的空间中,以此表征漏洞文本的语义信息。其次,针对传统的机器学习算法在处理高维性和稀疏性的漏洞文本特征表现不好和忽略特定的漏洞信息的问题,本文基于卷积神经网络和循环神经网络理论基础,充分利用卷积神经网络提取漏洞文本向量局部特征的优势和循环神经网络提取与漏洞文本上下文相关的全局特征的优势,将两种互补模型提取的特征进行融合,建立了一种新颖的TextCGRU漏洞分类模型,使其能够表征更加漏洞特征信息。最后,对本文设计的基于TFI-W2V的TextCGRU漏洞分类方法进行实验验证和结果分析,并与基于深度神经网络的软件漏洞自动分类方法进行对比实验,实验结果表明了本文提出的漏洞分类算法在平均准确率、宏精确率、宏召回率和宏F1等指标中均有较大的提高。本文的研究工作显示了基于NLP神经网络的软件漏洞自动分类方法在漏洞分类中获得了很好的效果,大大提高了软件漏洞分类管理的效率和准确率,因此具有一定的应用研究价值。
其他文献
复杂网络是指具有自相似、自组织、小世界和无标度等特性的网络。随着社会的发展,各个领域均能在现代高级技术的支持下抽象为对应的复杂网络。链路预测是研究复杂网络、认识复杂系统的重要手段之一,在理论层面与应用层面都有不可或缺的价值与意义。首先,在无向无权网络中,基于节点相似性的算法和基于路径相似性的算法等的大多算法只考虑基于节点相似性方面或基于路径相似性方面,节点与路径的混合链路预测算法较少,且只考虑到了
学位
本文基于亚马逊平台茉莉花茶产品进行数据挖掘,采用描述性统计、相关性分析与固定效应模型,研究亚马逊平台的茉莉花茶产品跨境电商消费者偏好。研究表明:(1)茉莉花茶产品总点击量与关键词销售占比共同促进了茉莉花茶产品购买次数。(2)等级越靠前的店铺茉莉花茶产品总点击量对于购买次数正向效应越显著。因此,本文通过数据分析探讨亚马逊平台的茉莉花茶产品跨境电商消费者偏好,为推进我国跨境电商行业高质量的可持续发展与
期刊
近年来,我国经济水平发展的同时也带来了严重的空气污染物,其中PM2.5污染尤为严重。如何有效分析影响因素对PM2.5浓度的影响程度,进而实现PM2.5浓度的预测,对治理PM2.5污染具有重要的指导意义。本文以石家庄市PM2.5浓度数据为研究对象,通过获取的数据,充分考虑污染物因素和气象因素对PM2.5浓度变化的影响,建立影响因素特征提取模型提取主要影响因素,并提出建立混合预测模型对PM2.5浓度进
学位
本文通过对“陶味”教育,幼儿劳动教育生活化价值以及“陶味”下幼儿园劳动教育的生活化进行了相应的研究,指出幼儿教师要注意挖掘自身与幼儿的榜样价值,充分发挥榜样的指导作用,根据幼儿的爱好开展劳动教育游戏,同时注意利用家校共育的教育方式,也要在劳动教育过程中不断加强与实际生活的联系,真正实现劳动教育回归现实生活,促使幼儿收获并享受劳动成果,丰富幼儿的劳动体验。
期刊
新课改背景下,国家颁布了全新的体育教学指导纲要,体育教学不仅需要传播知识技能,还需要打造出情境化、结构化、条件化的体育课堂,强化学生的核心素养。基于此,本文从小学体育单元化教学活动设计入手,明确小学体育课堂的实践路径(包括教学活动、教学方法、后续评价等环节),以求打造出以学生为主体的大单元教学活动,促进学生更好成长。
期刊
空气质量由于受到多种因素的影响而表现出复杂的变化模式。多变的大气反应系统使得空气污染物浓度的精准预测面临严峻挑战。对于每小时的空气污染物浓度预测问题来说,考虑空气污染的时空动态关系,分析大气污染物来源及异地输送轨迹传播规律,将对区域空气质量的精准预测是十分有益的。基于此,本文提出了一种基于大气污染物传播路径分析的空气质量预测方法,该方法充分考虑空气质量演变特征的时空动态关联关系,以搭建更精确、稳定
学位
本文研究的指向是从新中国成立至新时代发展时期的陶瓷艺术变迁与审美倾向的演变,景德镇陶瓷艺术作为中国陶瓷史上最为璀璨的部分,其装饰变革对当下陶瓷艺术走向产生着重要影响,景德镇因其独特的地域性和人文特色,在彩绘的发展历程中促使着装饰逐渐向绘画延伸,正如清末浅绛彩瓷绘从陶瓷装饰的束缚中崭露风采,象征着陶瓷装饰性与绘画性并存,并独立衍生出陶瓷绘画这一新的艺术形式。文章尝试从陶瓷装饰性的变化、重建及跨越到独
期刊
随着遥感技术和地理学不断向着多学科、多领域的方向发展,国内外遥感学家和地理学家面对不同的研究目标开发了大量的遥感地学模型,这些模型是解决复杂地球科学的有力手段,是认识自然规律的有效工具,在未来预测、现象理解、异常诊断、综合分析以及管理决策等方面均是不可或缺的。遥感模型集成是一种综合多学科模型和集成多种遥感地学资源,从整体上系统地研究环境问题的重要途径。但是由于模型的异构性和复杂性,传统的模型集成方
学位
随着区块链技术受到政府部门和金融机构等行业的广泛关注,学术界对区块链的理论研究也达到了热潮。为了提高区块链系统的运行效率,在离散时域内研究区块链系统交易的基本运行流程,建立数学模型,进行性能分析及系统优化。首先,基于每个区块的容量均有上限和区块所容纳的交易同时验证两个特点,引入限量机制和批量服务机制,构建带有批量服务的G-限量休假模型。采用嵌入马尔科夫链的方法,给出系统服务期开始时刻的交易数母函数
学位
人脸识别作为模式识别领域一个极其重要的分支,其在视觉领域技术中的应用不可替代。随着信息技术的发展,计算机视觉技术与数学的相结合,人脸识别的应用越来越成熟。但是在实际生活中,往往不能控制光照造成的阴影对人脸的遮挡而提供特别理想的人脸图像,使得一般的人脸识别表现得不理想,不能满足实际需求,因此如何解决光照造成人脸被阴影遮挡导致识别效果变差成为了实际应用中的人脸识别乃至模式识别领域有待解决的问题。在综合
学位