基于生成对抗网络的恶意代码识别研究与应用

来源 :北京化工大学 | 被引量 : 7次 | 上传用户:axcom
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恶意JavaScript代码被广泛应用在攻击客户端浏览器,窃取用户的隐私,使网络安全受到严重的挑战。为了保护用户免受攻击,需要在这些恶意代码被执行前检测出来。恶意代码检测的方法有静态方法和动态方法。静态方法检测效率高,并且不需要执行JavaScript代码,但由于新的恶意代码常常拥有新的特征模式,所以采用静态方法很难检测出来;动态方法通常需要在模拟环境中执行JavaScript代码,分析其运行时状态和行为变化,即使对于新的恶意代码也有很高的识别率,但是每次分析都需要大量时间模拟执行,所以效率不高。近几年学者将机器学习方法引用到恶意代码的识别上,通过使用样本对分类器进行训练,在恶意代码的识别效率和对新型恶意代码的检测上都取得了不错的效果。基于机器学习的方法需要收集大量的已标记的样本,但恶意JavaScript代码存在收集困难,人工标记困难等特点。本文通过改进生成对抗网络(Generative Adversarial Nets,GAN),提出了一种使用对抗网络生成样本训练模型的方法,并提高模型识别的准确率。针对样本不足导致传统分类器训练结果不理想的问题,本文提出使用生成对抗网络生成样本的方法,扩充训练数据集,提高传统分类器训练识别准确率。使用有标签样本、无标签样本、生成器生成的样本一起训练生成对抗网络,通过定义不同的损失函数,让GAN中的判别器和生成器达到纳什平衡,即双方无法再改变策略以提高己方的利益。使用生成器生成大量样本,加入对传统分类器的训练,提高对恶意JavaScript代码的检测能力。为了验证本文提出方法的效果,分别选取了 RF、LR、DT、SVM、KNN五种传统分类器并且在实验中训练数据分别设置为100、200、300、400、500五种大小,观察实验中模型的检测率变化情况,结果表明生成样本对于只有少量样本的情况,可以显著提高分类器的检测效果。在训练好模型之后,使用python编写了一个恶意代码检测工具-MDProxy,通过将浏览器的代理设置为代理服务器的地址,可以通过MDProxy检测工具过滤用户所有的http访问流量。将训练好的模型应用到代理工具中,通过对JavaScript脚本的过滤检测,对恶意的JavaScript进行拦截,并向浏览器端返回警告信息,提醒用户网站有风险。针对本文提出的方法设计实验,对5种大小的训练集、5种分类器进行检测率比较,实验结果表明,本文提出的方法可以使得传统分类器的检测能力提高5%。
其他文献
通过对教科书内容的分析,论文发现教科书的内容并不是价值中立、客观的。而是具有社会意识形态的,是经过社会统治阶级的合法化的结果。本文从教科书中的显性内容和隐性内容分
<正> 无水胶印是指不需要润版液,用斥墨的硅橡胶层作为印版的空白部分,使用特殊油墨,在一定的温控系统控制下来完成印刷的一种平版印刷方式。无水印刷过程操作简单,减少了调
明确界定企业社会责任缺失的概念是进行企业社会责任缺失研究的基础,本文在界定企业社会责任缺失概念的基础上,系统阐述了企业社会责任缺失概念的模型、内涵和外延。 Clearl
目的研究白藜芦醇调控miR-506对黑色素瘤细胞增殖、迁移、侵袭的影响和机制。方法qRT-PCR测定白藜芦醇处理后黑色素瘤细胞中miR-506表达变化,在黑色素瘤细胞中转染miR-506 in
<正>一、科斯理论的基本原理美国芝加哥大学教授、1991年诺贝尔经济学奖的获得者罗纳德·哈里·科斯认为,在某些条件下,经济的外部性或者说非效率可以通过当事人的谈判而得到
通过实例分析了在排气筒组中,以不同的排气筒高度作为起点依次等效,不会影响等效排气筒污染物排放速率和等效排气筒位置的计算结果,但会对等效排气筒高度的计算产生影响。研究表
1资料与方法1.1一般资料:①入选标准:从2006年1月-2007年12月底,经我站门诊临床确认为轻、中度下呼吸道感染者124例,收入内科住院治疗。治疗前经X线胸片示肺部浸润性病变,试验开始
油基钻井液以其优良的性能在国际上倍受重视,近几年,随着页岩油气勘探开发热潮的升起及海洋钻井的发展,油基钻井液应用量逐渐增加,但油基钻井液钻井对录井的影响是客观存在的
这款名为WaveRange的概念产品要赋予微波炉全新的功能和形象。看上去,它相当于把微波加热和食物分开来,这能促进食物的烹饪,而不是简单地加热。机身由金属,ABS和派热克斯玻璃制成
金属注射成形技术在制备形状复杂,组织结构均匀及高性能的近净形金属零部件方面具有独特的优势。但注射成形零件常出现密度分布不均、表面流痕、裂纹及连接线等缺陷影响美观,