基于CNN-BiLSTM与多特征融合的恶意软件分类研究

来源 :武汉邮电科学研究院 | 被引量 : 0次 | 上传用户:zw975526
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
据统计,2020年以来,我国境内捕获的恶意程序达261,603个,恶意软件的攻击造成的后果十分严峻。针对数量庞大的恶意软件,针对恶意软件的分类显得尤为重要,准确率更高的分类方法可以帮助我们更好的应对恶意软件的攻击。而随着恶意软件的不断进化,种类不断增多,传统的静态分类方法与动态分类方法已无法应对新兴的恶意软件,因此,本文采用多特征融合与深度学习相结合的方式,提出一种新的分类模型,经实验数据验证,分类效果比传统方式取得了更高的准确率。本文主要的研究内容如下:⑴将恶意软件可执行文件反编译生成.bytes文件与.asm文件,通过特征提取算法,提取汇编文件中的n-gram指令特征。使用B2M算法将二进制文件灰度图化,并提取灰度图中的纹理特征,并设计了一种特征融合算法,实现了两种特征的融合。⑵本文在LSTM长短期时记忆网络模型的基础上,提出一种基于BiLSTM双向长短期时记忆网络的分类模型。使用控制变量法,求出了BiLSTM模型的最佳参数。将n-gram特征、纹理特征,以及融合特征,分别输入到BiLSTM模型中,发现融合特征作为输入特征,得到的分类准确度平均值达到了96.8%,相比于单一特征得到的准确率96.1%,提高了0.7个百分点。同时通过对比实验,BiLSTM模型对恶意软件家族的分类效果,要高于随机森林、SVM、KNN等传统模型。⑶本文根据CNN卷积神经网络模型的结构特点,设计了一种基于CNNBiLSTM联合的网络模型,并通过调参使得模型达到最优化,通过对比实验分析,CNN-BiLSTM模型对恶意软件家族的分类准确率达到了97.39%,比BiLSTM模型提高了0.59个百分点。本文在原有模型的基础上,设计引入了一种过采样方法和一种损失函数,使模型的分类效果又进一步提高了0.16个百分点,达到了97.55%,证明了该模型对恶意软件家族分类有良好的性能。
其他文献
信息的重要程度越来越高,各行各业都被海量的信息所覆盖,这海量的信息中包含着多种模式的信息载体,形如文本、视频、图片、语音等,其中文本则是这些信息的最重要的载体之一。然而在船舶领域,还没有形成一套合理的分类流程与方法,在区分专业性极强的船舶文本信息时需要进行人工比对,这将花费大量的人力资源成本和时间成本。本文就此问题提出一套可行的解决方案,并在原算法基础上进行创新。本文主要研究将文本分类相关技术应用
学位
光纤光栅应变传感器所具有的重量轻、易安装、可复用以及抗电磁干扰等优点使其可以很方便进行应变场的长期监测,这一特性在结构健康监测领域中有着重要应用。基于全同弱反射光栅阵列的分布式高速应变测量系统采用时分+波分复用的解调方式,与布里渊散射技术实现的分布式应变传感系统相比有着更高的解调速度,同时,相较于普通光栅技术实现的应变传感系统其有更长的探测距离以及更大的光栅容量。本文以基于全同弱反射光纤光栅阵列应
学位
随着城市工业化、现代化进程的持续加快,城市规模扩张,工程建设量急剧增加造成事故频发,对消防救援队伍的救援响应速度、救援资源调度分配、现场救援作业、科学施救、重点单位预案录入等综合能力提出更高要求,越来越多的信息化手段全面融合消防业务管理和实战应用,为适应城市消防指挥中心的接处警工作要求,针对当前大多数接警系统信息录入、力量调配效率偏低等问题。本文提出一种基于ALBERT的预训练模型在接处警系统中对
学位
近年来,自然语言处理关键技术之一语义解析得到越来越多人的关注,NL2SQL任务属于语义解析,NL2SQL任务是将自然语言描述通过模型将其转换成可执行的SQL查询语句。由于中文文本与英文文本之间的差异,因此不能直接将以往基于英文数据集的NL2SQL模型应用到中文文本上。同时,现有的NL2SQL模型中一般都使用序列生成模型来预测条件值,此方法预测得到的条件值准确性较低,预训练模型也只使用BERT,而其
学位
虚拟试穿的目的是转移目标服饰图像到参考人图像上,是最近几年的热门话题。现有技术通常侧重于在生成图像上保留服饰图像的原有特征。但当参考人图像中出现大量遮挡以及复杂姿势时,生成清晰合理的试穿图像仍然是一个挑战。本文采用渐进式的生成逻辑,先生成预测语义分割图,再由预测语义分割图结合原参考人和服饰自适应地保留非目标区域,并生成目标区域的信息,完成试穿图像的构建。此外,本文采用小数据集小尺寸图像进行训练,并
学位
运用2016~2020年面源数据,采用区位商、集中系数、优势指数测算与比较全国7个苹果主产区集群集中度及竞争力。研究表明:(1) 7个苹果主产区均具有专业化优势和集群发展优势。其中,陕西省苹果产业发展优势最显著,且集群优势要优于专业化优势;山西省与陕西省专业化优势的差异较小,而集群发展优势差异较大;近5 a甘肃省苹果产业的专业化程度和集中化程度呈增长态势;山东省、辽宁省、河北省的苹果产业的专业化程
期刊
随着深度学习越发成熟,目标检测已经成为计算机视觉领域中一项非常重要的基础性任务并受到了研究者们重点的关注。该技术已经被广泛的应用在如人脸识别、动作识别、实时监测等不同领域。在目标检测领域,较为主流的算法就是通过应用卷积神经网络来对图像进行特征提取的算法。随着算法的不断改进,如何针对复杂场景下图片特征的提取,同时保证不同尺度下的特征图的平衡性成为了提高算法模型精确度和实用性的关键。当今YOLOv5算
学位
智能手机早已风靡全球,在智能手机中安卓手机占据了四分之三的份额。随着时间的发展,各种安卓恶意软件大量出现。现有的恶意软件识别方案大都是使用的监督学习方法进行分类,这种分类方法精确率高速度快,但面对新出现的样本时分类效果差,使用无监督学习的聚类算法在处理未知样本时效果要更加优秀。本论文针对分类算法处理未知样本效果差的问题,参考最大最小蚁群算法和蚂蚁排序算法以及层次凝聚聚类算法,提出了一种基于改进蚁群
学位
近年来,柔性结构与材料的大规模开发与应用对其结构的形变实时监测技术提出了许多新的要求。相比于其他形状感知技术,光纤传感技术具有抗电磁干扰、生物相容性且易于集成等特点,因此被认为是下一代传感技术的重要组成部分。目前,由于已开发的光纤形状传感技术受到光纤应变测量技术与三维重构算法等因素制约,仍存在测量精度不理想、测量离散化与高重构误差等问题。本论文针对上述问题,设计了一种具有高空间分辨率的分布式光纤三
学位
<正>近年来,陇南苹果产业逐步形成了向优势区域集中生产的格局。针对此,我们从多方面分析了目前陇南苹果产业具有的独特发展机遇与发展优势,同时提出了促进陇南苹果产业升级转型与创新优化的一系列发展措施,以期全面推动与促进未来陇南苹果产业的可持续发展。在传统农业与现代产业交替发展之际,大力保障苹果优势区域的品牌,对我市农业产业发展具有战略性意义。
期刊