深度学习在恶意代码分类中的研究

来源 :海南师范大学 | 被引量 : 0次 | 上传用户:minghao1122
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在互联网的普及和发展过程中,网络安全已然成为一个越来越令人关注的问题,恶意代码也已经成为了网络安全中的主要威胁之一,不同类型的恶意代码具有不同的功能,造成不同的危害。然而伴随着国内外恶意代码检测技术的提高,恶意代码也在更新升级,不断的出现新型的恶意代码以及恶意代码的变种,这对恶意代码的分类提出了更大的挑战,因此,如何提高恶意代码分类的准确率和效率成为亟待解决的问题。随着大量恶意代码数据的出现,以及样本不均衡问题日益突出,传统机器学习算法的分类准确率和效率越来越差,而深度学习在各个领域中取得的效果证实了深度学习能够提高大数据识别的精度,已有部分文献使用了深度学习用于恶意代码的分类。本文在原有深度学习算法的基础上,提出了改进的深度学习算法,并且将深度学习中的图神经网络用于恶意代码的分类中,进一步提高分类的准确率和效率。本文的主要工作如下:(1)本文基于反汇编得到恶意代码数据集的ASM文件,并分析文件中操作码的特征,研究了三种恶意代码的特征提取方式,包括灰度纹理图像、N-gram文本特征以及生成图的方法,并给出了特征提取的过程,作为后续深度学习模型的输入层。(2)本文提出了基于卷积神经网络(Convolutional Neural Network)和正则化算法(Batch Normalization)的恶意代码分类,即构建了CNN_BN模型,并给出了模型的最优参数。卷积神经网络模型可以提取恶意代码的高级特征,正则化算法不仅加快了深度模型的训练过程,而且能有效防止模型的过拟合,从而提高模型的泛化能力。文中将CNN_BN模型与传统机器学习算法(随机森林和支撑向量机)和其他深度学习模型(循环神经网络)、以及已有文献中的方法进行了比较,实验结果表明,基于CNN_BN模型其分类准确率达到了98%,AUC以及平均的F1值分别达到了0.97和0.95,在分类结果上优于其他方法。(3)本文提出了基于图注意力网络(Graph Attention Network)的恶意代码分类,即构建了GAT模型。通过余弦距离以及恶意代码API共现特征构建具有点和边的图结构数据,GAT通过注意力机制计算图中某个节点相对于每个邻接节点的注意力,将节点本身的特征和注意力特征聚合起来作为该节点的特征,在此基础上进行节点的分类。文中将GAT与CNN_BN模型在分类准确率和效率上进行了比较,GAT模型其分类准确率达到了99%,AUC以及平均的F1值分别达到了0.99和0.97,并且GAT分类模型的时间效率远优于CNN_BN模型。
其他文献
人类最初的书写是为了表达内心所想和与人交流。绘画中的“书写性”,亦是展露出人类在作画时,对世间万物的好奇、感受和情绪,是人类面对已有过去的触摸与总结,是面对未知未来的揣测和期许,面对正经历的事件的记录和情绪抒发。本文所分析的绘画中的“书写性”是从绘画的笔触、线条、情感、意境来展开的,西方现当代艺术形式中有受到中国书法的影响。威廉·德·库宁(1904.04-1997.03)的绘画中,有绘画中立体与平
近些年,随着疫情的爆发和扩散,线上教学已经成为常态。钢琴课程作为高校音教专业的必修课程,在日常学习和生活中占有着重要的位置。与此同时在线教育经过长时间的发展,已经形成了体系化、规模化的学习教育体系,在线教育结合着互联网的特点,凸显着互联网的共享性、便捷性。艺术领域的钢琴教育借着东风,也渐渐地兴起了在线钢琴教育,从最初的网络视频课程到MOOC到微课到翻转课堂,形式不断升级变化。有了这些基础,便让高校
现有人脸识别模受口罩等遮挡因素影响导致准确率无法提升。当前主流研究方法将有无遮挡场景分开训练后,整合应用于多场景。针对遮挡人脸识别模型的局限性,提出一种改进人脸特征矫正网络(FFR-Net)模型。该模型可同时用于有无遮挡人脸识别并应用于口罩与眼镜遮挡两种识别场景中。人脸特征矫正网络模型提出了一种人脸特征矫正模块,为保证充分利用无遮挡区域特征信息,在该模块中的空间分支引入involution算子扩大
学位
现如今,语篇教学对高中英语教学的重要性逐渐凸显出来,越来越多教师意识到做好英语语篇的词汇及语法讲解、口语综合练习教学等非常重要。ESA教学理论灵活性、功能性强,将其应用到高中英语语篇教学中,可以提升高中英语语篇教学的有效性。文章详细介绍了什么是ESA理论以及当前高中英语语篇教学的情况,并对在高中英语语篇教学中应用ESA理论的路径进行分析,提出建议。
在互联网技术和计算机系统飞速发展的今天,计算机用户在享受网络带来的便利的同时,还饱受计算机网络和个人信息存储安全威胁的困扰,尤其是恶意软件的威胁一直居高不下。因此,如何高效、准确地对恶意代码家族进行识别、分类及溯源成为了当今保证互联网安全的重要研究内容。近年来,国内外已经有许多关于恶意代码变种分类的研究,提出了各种恶意代码分类模型,但由于恶意代码预处理时损耗特征、分类模型过于复杂,仍存在模型预测准
面对大数据、云计算和物联网等新兴技术高速发展所提出的时代挑战,如何通过适宜的权力关系重构组织系统,从而持续激励员工的自主性、创新性和增强组织韧性,是亟待解决的组织管理难题。本文从互系性出发,将组织权力划分为技术—经济范式下的权力和情感—价值范式下的权力,并将家庭式组织作为权力体系耦合的具体组织形态。在此基础上,本文构建了德性领导通过耦合权力体系生成家庭式组织的具体框架,包括通过教谕式调节促进组织权
在我国,政府数据开放是各级政府大数据战略的核心内容。政府数据开放工作有一系列的好处,包括提高政府透明度、促进公众参与、促进利益相关者之间的合作等。但是政府数据开放是一把“双刃剑”,随着政府数据开放的日益普及,数据开放与隐私保护之间的问题越来越突出,保护公民隐私也成为政府数据开放的一项重要任务。本文参考能力成熟度模型和数据安全能力成熟度模型,梳理总结隐私保护的实践与研究,构建政府数据开放隐私保护成熟
目的非酒精性脂肪肝病(NAFLD)和慢性乙型肝炎(CHB)是全球常见的慢性肝脏疾病,NAFLD合并CHB(NC)的现象越来越普遍。我们和他人前期研究表明NAFLD和CHB患者中肝脏全基因组DNA甲基化水平明显下降,而NC是否会进一步降低全基因组DNA甲基化水平目前尚不知晓。甜菜碱是一种供甲基营养素,可缓解NAFLD,降低血清中的HBV DNA含量,但其机制不明。因此,本研究通过人群研究观察NC患者
国家安全学是一门在总体国家安全观指导下服务国家安全实践与理论需求的综合性、交叉性核心支撑学科,在中国特色社会主义建设征程中丰富发展,在服务中国特色国家安全道路的重大理论和现实需求中茁壮成长。立足系统思维,从学科体系、学术体系和话语体系建设的角度探索中国国家安全学自主知识体系构建,是中国国家安全学发展的核心路径。其中,中国国家安全学学科体系构建应以总体国家安全观为指导思想,明确国家安全学的交叉学科属